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PREFÁCIO , 
À TERCEIRA EDIÇÃO 


Este livro teve como origem o texto de um curso de Álgebra Linear, 
oferecido para alunos de Engenharia, Física, Matemática, Estatística e Computação 
da Universidade Estadual de Campinas. O programa foi estabelecido tendo em vista 
que seria o único curso de Álgebra Linear que a maioria dos alunos receberia. 

Por isso, procuramos englobar os assuntos que seriam indispensáveis aos cursos que 
estes alunos seguissem posteriormente. Ele foi ministrado numa disciplina de 
segundo semestre que é sequência de um curso, também semestral, de Geometria 
Analítica. 

Os pré-requisitos para a leitura deste texto são os tópicos de Matemática, 
normalmente vistos até o curso Colegial. A partir destes, introduzimos e 
desenvolvemos razoavelmente os conceitos básicos de Álgebra Linear, procurando 
sempre indicar aos alunos as fontes às quais eles podem recorrer para aprofundar 
seus conhecimentos. 

Alunos que cursam pela primeira vez esta disciplina, frequentemente 
julgam-na muito abstrata e não vêem como podem utilizar os conceitos básicos. 

E, normalmente, muitos cursos terminam sem que se mostre aos alunos uma 
aplicação concreta de tudo o que aprenderam. 


Procuramos, então, dar aos tópicos uma abordagem com dois objetivos: 

1. Conseguir uma exposição da matéria, de tal forma que a ênfase seja 
colocada no uso dos conceitos. Neste sentido, optamos por uma exposição em 
que estes sejam introduzidos, na medida do possível, dentro de um contexto 
onde surja a necessidade de sua apresentação. Algumas demonstrações são propostas 
na forma de exercícios, o que permite uma maior fluência do texto e possibilita 
ao aluno desenvolvê-las dentro do seu raciocínio lógico. 

2. Encaminhar os conceitos para a solução de problemas nos quais os alunos 
já tenham sentido dificuldade. Desta forma, é conveniente fixar qualquer um dos 
capítulos (Cap. 11: Classificação de Cônicas e Quádricas; Cap. 12: Resolução de 
Sistemas de Equações Diferenciais, Cap. 13: Processos Iterativos; Cap. 14: Conjuntos 
Convexos e Programação Linear), como chave, ou seja, um capítulo que englobe 
os diversos conceitos apresentados no livro. Na busca das soluções para os 
problemas que colocamos nestes capítulos recorremos à maioria dos conceitos 
incorporados em um curso tradicional de Álgebra Linear (noções de espaço 
vetorial, autovalores e autovetores, diagonalização de operadores), de modo que 
os alunos possam perceber a inter-relação entre eles e a aplicação conjunta 
dos mesmos. 


Dentro desta perspectiva, poderíamos sugerir algumas sequências para 
o desenvolvimento de um curso de Álgebra Linear: 

1. Capítulos 1a 11; 

2. Capítulos 1 a 8e 12; 

3. Capítulos 1a 8e 13; 

4. Capítulos la 8e 14. 

Uma outra sugestão é a de que o conteúdo deste livro seja desenvolvido, 
como já vem sendo feito, em disciplinas que integrem os tradicionais cursos de 
Cálculo, Álgebra Linear e Equações Diferenciais. 

Quanto aos aspectos didáticos, gostaríamos de ressaltar que os exercícios 
são importantes inclusive como extensão de cada capítulo. O conteúdo foi 
elaborado de modo a se enquadrar em diversos programas, podendo-se deixar 
de estudar as seções assinaladas com asterisco sem prejuizo do entendimento dos 
tópicos abordados. Por exemplo, seções como Cadeia de Markov (seção 1.5) 

e Ajuste de Curvas (8.8), que são tópicos especiais, podem ou não ser incluídas 
de acordo com o interesse de cada aluno, grupo ou classe. 

Nesta terceira edição, a antiga seção 4.9 foi ampliada e transformada no 
atual Capítulo 14: Conjuntos Convexos e Programação Linear. A relativa 
simplicidade deste assunto e seu grande número de aplicações práticas são 
responsáveis por sua difusão e interesse nos últimos anos. Anexamos a este novo 
capítulo uma seção de autoria do Prof. Antonio Carlos Moretti, que descreve 
o algoritmo do método simplex para programação linear e indica as etapas para 
a programação por microcomputadores deste método. 

A nossa experiência, assim como a de outros professores, tem mostrado 
que o núcleo de um curso introdutório de Álgebra Linear e, portanto, o deste 
livro, corresponde à matéria exposta nos Capítulos de 1 a 8, podendo ser 
excluídas as seções 7.2 a 7.4, dependendo dos objetivos a atingir. 
Recomendamos especial atenção aos capítulos introdutórios, principalmente 
ao que trata de Sistemas Lineares, e que fornecerão a base técnica indispensável 
para a boa compreensão dos demais capítulos, além de conterem em si métodos 
fundamentais aplicáveis a muitas situações. Acreditamos que as seções e capítulos 
altemativos permitam opções para trabalhar com os conceitos de Álgebra Linear 
em diferentes áreas. 

Queremos agradecer a todas as pessoas que leram e utilizaram o livro, 
enviando sugestões, e de modo especial aos professores Antonio Carlos Gilli Martins 
e João Frederico C. A. Meyer. 


Os Autores 


MATRIZES 


1.1 INTRODUÇÃO 


Nesta seção, apresentamos os conceitos básicos sobre matrizes. Estes conceitos 
aparecem naturalmente na resolução de muitos tipos de problemas e são essen- 
ciais, não apenas porque eles “ordenam e simplificam” o problema, mas tam- 
bém porque fornecem novos métodos de resolução. 

Chamamos de matriz uma tabela de elementos dispostos em linhas e co- 
lunas. Por exemplo, ao recolhermos os dados referentes a altura, peso e idade 
de um grupo de quatro pessoas, podemos dispô-los na tabela: 


E | amm | Altura {m} Peso (kg) Idade (anos) 


Pessoa 1 


Pessoa 2 


Pessoa 3 
Pessoa 4 
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Ao abstraírmos os significados das linhas e colunas, temos a matriz: 


1,70 70 23 
1,75 60 45 
160 52 25 
181 72 30 


Observe que em um problema em que o número de variáveis e de observações é 
muito grande, essa disposição ordenada dos dados em forma de matriz torna-se abso- 
lutamente indispensável. 


Outros exemplos de matrizes são: 


2x -l 
2 3 [3 0 1] [1] 
(0 x 


Os elementos de uma matriz podem ser números (reais ou complexos), funções, 
ou ainda outras matrizes. 
Representaremos uma matriz de m linhas e n colunas por: 


du 42 Qin 
áz 822 ûn 

Amxn = . : : = [a;)mxn 
amı m2 ns amn 


Usaremos sempre letras maiúsculas para denotar matrizes, e quando quisermos 
especificar a ordem de uma matriz A (isto é, o número de linhas e colunas), 
escreveremos A xn- Também são utilizadas outras notações para matriz, além 
de colchetes, como parênteses ou duas barras. Por exemplo: 


2 + 
0 4 
Não obstante, neste livro as matrizes aparecerão sempre entre colchetes. 


Para localizar um elemento de uma matriz, dizemos a linha e a coluna 
(nesta ordem) em que ele está. Por exemplo, na matriz: 


l 0 -4 
mali -3 A 


o elemento que está na primeira linha e terceira coluna é -4, isto é, a = -4, 
Ainda neste exemplo, temos a, = l, & = Q, 4&3, =4.4p=3e43=2. 


2 -l 
0 4 
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1.1.1 Definição: Duas matrizes Amxn = [ajjlmxn € Brxs = Ibijlxs são 
iguais, A = B, se elas têm o mesmo número de linhas (m = r) e colunas (n = 
= s), e todos os seus elementos correspondentes são iguais (a; = bij). 


E. lo: x 
FMPD 2 1 logi] [9 sen90” O 
2 2 5]7 l2 4 5 


1.2 TIPOS ESPECIAIS DE MATRIZES 


Ao trabalhar com matrizes, observamos que existem algumas que, seja pela 
quantidade de linhas ou colunas, ou ainda, pela natureza de seus elementos, 
têm propriedades que as diferenciam de uma matriz qualquer. Além disso, estes 
tipos de matrizes aparecem frequentemente na prática e, por isso, recebem no- 
mes especiais. 

Consideremos uma matriz com m linhas e n colunas que denotamos por 


Amxn: 


1.2.1 Matriz Quadrada é aquela cujo número de linhas é igual ao número 
de colunas (m = n). 


Exemplos: 


No caso de matrizes quadradas A, xm, costumamos dizer que A é uma matriz 
de ordem m. 


1.2.2 Matriz Nula é aquela em que aj = O, para todo i e j. 


Exemplos: 
0 0 0 00 090 
mafo J eBxs=l0 0 00 O 
9 0 0000 


1.2.3 Matriz-Coluna é aquela que possui uma única coluna (n = 1). 


Exemplos: 


Analogamente, temos: 
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1.2.4 Matriz-Linha é aquela onde m = 1. 
Exemplos: 3 o -1] e fo o] 


1.2.5 Matriz Diagonal é uma matriz quadrada (m = n} onde aj = 0, para 
i + j, isto é, os elementos que não estão na “diagonal” são nulos. 


Exemplos: 


oo ow 
ooo 
ow Sd Oo 
wooo 


Um exemplo importante de matriz diagonal vem a seguir. 


1.2.6 Matriz Identidade Quadrada é aquela em que aj; = 1 e aij =0, para 


iz j. 
100 

n= fo 1 ole nefi $ 
001 


Exemplos: 
1.2.7 Matriz Triangular Superior é uma matriz quadrada onde todos os 
elementos abaixo da diagonal são nulos, isto é, m = n e ayj = O, para i > j 


Exemplos: 


1.2.8 Matriz Triangular Inferior é aquela em que m = ne aij = 0, para 
i<j. 


Exemplos: 
2 0 0 
14100 50 0 
1 22 01º 70 0 
1 0 54 * 13 


Matrizes 


1.2.9 Matriz Simétrica é aquela onde m = n e aj; = aji. 


Exemplos: 
b cad 
4 3 l a 
zn o e e Ee 
i o0 5 c f h i 
d g i k 


Observe que, no caso de uma matriz simétrica, a parte superior é uma “refle- 
xão” da parte inferior, em relação à diagonal. 


1.3 OPERAÇÕES COM MATRIZES 


Ao utilizar matrizes, surge naturalmente a necessidade de efetuarmos certas ope- 
rações. Por exemplo, consideremos as tabelas, que descrevem a produção de grãos 
em dois anos consecutivos, 


3000 20 
700 350 
1000 100 


5 


Se quisermos montar uma tabela que dê a produção por produto e por região 
nos dois anos conjuntamente, teremos que somar os elementos corresponden- 
tes das duas tabelas anteriores: 
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3000 200 400 600 5000 50 200 O 8000 250 600 600 
700 350 700 100]+| 2000 100 300 300|=|2700 450 1000 400 
1000 100 500 800 2000 100 600 600 3000 200 1100 1400 


Ou seja: 


Produção de grãos (em milhares de toneladas) durante os dois anos 


RR RC O e 


250 600 600 
450 1000 400 
200 1100 1400 


Podemos considerar agora a seguinte situação. Existem muitos incentivos 
para se incrementar a produção, condições climáticas favoráveis etc., de tal 
forma que a previsão para a safra do terceiro ano será o triplo da produção do 
primeiro. Assim, a matriz de estimativa de produção deste último será: 


soja feijão arroz milho 
3000 200 400 600 9000 600 1200 1800 | Região A 
3. 700 350 700 100] =|2100 1050 2100 300 Região B 
1000 100 500 800 3000 300 1500 2400 | Região C 


Acabamos de efetuar, neste exemplo, duas operações com matrizes: soma e 
multiplicação por um número, que serão definidas formalmente, a seguir. 


1.3.1 Adição: A soma de duas matrizes de mesma ordem, Amxn = 
= [aj] e Bmxn = [by], é uma matriz m x n, que denotaremos A + B, cujos 
elementos são somas dos elementos correspondentes de A e B. Isto é, 


A+B= lay + bijlmxn 


l ~i o 4 1 3 
4 O|l+|-2 5Sl=|2 5 
2 5 1 0 3 5 


Observe que, pela forma com que foi definida, a adição de matrizes tem as 
mesmas propriedades que a adição de números reais. 


Exemplo: 
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Propriedades: Dadas as matrizes A, Be C de mesma ordem m x n, temos: 
i) A+ B= B + A (comutatividade) 
ii) A + (B +C) = (A + B) + C (associatividade) 
iii) A + 0 = A, onde O denota a matriz nula m x n. 
Poderá ser usada a notação Om x n para a matriz nula, quando houver perigo de 
confusão com o número zero. 
A operação que definiremos a seguir é a multiplicação de uma matriz 
por um número (real ou complexo), também chamada muitiplicação por esca- 
lar. 


1.3.2 Multiplicação por Escalar: Seja A = laj;hm xn e k um número, então 
definimos uma nova matriz 


k- A = [kajilmxn 
Exemplo: 


Propriedades: Dadas matrizes A e B de mesma ordem m x n e números k, k e 
kz, temos: 
i) KA + B) = kA + kB 
i) (ki + ki)A =k A+ kiA 
iii) O. A = 0, isto é, se multiplicarmos o número zero por qualquer matriz 
A teremos a matriz nula. 
iv) ki(k5A) = (kik;)A 
Às vezes, é conveniente considerarmos as linhas de uma dada matriz como 
colunas de uma nova matriz. 


1.3.3 Transposição: Dada uma matriz A = [a;;lm xn, podemos obter uma 
outra matriz A' = [biln xm, cujas linhas são as colunas de A, isto é, bj = aji. 
A' é denominada transposta de A. 


1.3.4 Exemplos 
Exemplo 1: 
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Exemplo 2: 
13 ' 13 
s- |; j B= [; l 
Exemplo 3: 
1 ' 
p-o 2) 
Propriedades: 


i) Uma matriz é simétrica se, e somente se ela é igual à sua transposta, isto 
é, se, e somente se A = A”. (Observe a matriz B acima.) 
ii) A” = A. Isto é, a transposta da transposta de uma matriz é ela mesma. 
iii) (A + B) = A' + B'. Em palavras, a transposta de uma soma é igual à so- 
ma das transpostas. 
iv) (KAY = kA', onde k é qualquer escalar. 


Antes de definir uma outra operação, a multiplicação de matrizes, veja- 
mos um exemplo do que pode ocorrer na prática. 

Suponhamos que a seguinte matriz. forneça as quantidades das vitaminas 
A, B e C obtidas em cada unidade dos alimentos I e II. 


A B C 


Alimento I E 3 0 
Alimento II |5 0 1 


Se ingerirmos 5 unidades do alimento I e 2 unidades do alimento II, quanto 
consumiremos de cada tipo de vitamina? 

Podemos representar o consumo dos alimentos I e II (nesta ordem) pela 
matriz “consumo”: 


[5 2] 


A operação que vai nos fornecer a quantidade ingerida de cada vitamina é o 


“produto”: 
4 3 0 
Es 
oos afla o? 


=[5:4+2.5 5.3+2.0 5.0+2.1] 
= (30 15 2] 


Isto é, serão ingeridas 30 unidades de vitamina A, 15 de Be 2 de C. 
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Outro problema que poderemos considerar em relação aos dados anteriores é 
o seguinte: 

Se o custo dos alimentos depender somente do seu contéudo vitamínico e 
soubermos que os preços por unidade de vitamina A, Be C são, respectivamente, 
1,5, 3 e 5 u.c.p., quanto pagaríamos pela porção de alimentos indicada anterior- 
mente? 


1,5 
(**) Bo 15 2]-|3 
5 

= (30(1,5) +15(3) +2(5)] 


=[100] 
Ou seja, pagaríamos 100 u.c.p. 


Observamos que nos “produtos” de matrizes efetuados em (*) e (**), cada 
um dos elementos da matriz-resultado é obtido a partir de uma linha da primeira 
matriz e uma coluna da segunda. Além disso, com relação às ordens das matrizes en- 
volvidas, temos: 

Em (*) [hx2*llhx =x 
Em (**) [hx [hx [hx 

O exemplo anterior esboça uma definição de multiplicação de matrizes A e B, 
quando A é uma matriz linha. Esta noção de produto pode ser estendida para o 
caso mais geral, e os elementos da matriz-produto serão obtidos pela soma de produ- 
tos dos elementos de uma linha da primeira matriz pelos elementos de uma coluna 
da segunda matriz. Por exemplo, 


Sejam 
=| 8u fn 233 
Aox2 = 
421 n2 das 
bu by 
e  Bzx2 =|bn bz 
ba ba 


A matriz-produto AB é a matriz 2 X 2 definida como: 


bu bn 
AB = p a12 A . | ba ba 


dz, 422 423 
ba ba 
t aibi, + dba +t aiba anbu tanba t aa 
ab t nbz + azbz ambi + nbz + 423032 


Agora, passemos para a definição geral. 
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1.3.5 Multiplicação de Matrizes: Sejam A = [a;;lmxn € B = [brslnxp- 
Definimos AB = [cuvlm x p 


onde 


n 
Cuv = > Gukdkv = Guidiv + ... + AunPnv 
k=1 


Observações: 


i) Só podemos efetuar o produto de duas matrizes Amxn € Bixp se O nú- 
` mero de colunas da primeira for igual ao número de linhas da segunda, 
isto é, n = l. Além disso, a matriz-resultado C = AB será de ordem 

mxp. 

i) O elemento c;; (i-ésima linha e j-ésima coluna da matriz-produto) é obti- 
do, multiplicando os elementos da i-ésima linha da primeira matriz pelos 
elementos correspondentes 'da j-ésima coluna da segunda matriz, e soman- 
do estes produtos. 


1.3.6 Exemplos 


Exemplo 1: 
21 is aii 2+1+4+1:0 MD)+1-4 
4 2 É | =[4.1+2:0 4-1)+2:4 = 
5 3)sx 2x2 [5.1+3.0 Sc1)+3-4]»x 
2 2 
=|4 4 
5 7 
Exemplo 2: 


2 1 
f 3] Aia 
0 4 2x2 5 3 za 


Não é possível efetuar esta multiplicação, porque o número de colunas da primeira 
é diferente do número de linhas da segunda. 


Exemplo 3: 
1 0 0 6 1 
-2 3 0 6 1 “19 12 -8 
5 4 3 8 -2ļjx3 |12 62 -3 
0 1 4X2 3 8 -2 4x3 
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Propriedades: 
i) Em geral AB + BA (podendo mesmo um dos membros estar definido e o 
outro não). 
Exemplo: 
Vo 1 E 2 3 
Sejam A=|-3 2 -ljeB=|2 4 6 
-2 l 0 1 2/3 
0 0 0 -11 6 -l 
Então AB=|0 O 0jļje BA =|-22 12 72 
o 00 -l1 6 -l 


Note, ainda, que AB = 0, sem que A = 0 ou B = Q. 
Desde que sejam possíveis as operações, as seguintes propriedades são válidas: 
i) AI = IA = A (Isto justifica o nome da matriz identidade.) 
iii) A(B + C) = AB + AC (distributividade à esquerda da multiplicação, em re- 
lação à soma) 
iv) (A + B)C = AC + BC (distributividade à direita da multiplicação, em 
relação à soma) 
v) (AB)C = A(BC) (associatividade) 
vi) (AB) = B'A' (Observe a ordem!) 
vi) 0-A=0€0A-0=0 


1.4 EXERCICIOS 


1. Sejam 


-1 
L2 3 -2 0 1 
a=; i HEDE i es ; e D= [2 _-1] 


Encontre: 


ajJA+tB 
b)A.C 
c) B.C 
dC- D 
eD- A 
AD-B 
2) -A 

h) -D 


o a A w 


tua 


12 ÁLGEBRA LINEAR 


Seja A = 2 x? . Se A' = A, então x = 
aai. 2x-1 0 


. Se A é uma matriz simétrica, então A - A' = 

. Se A é uma matriz triangular superior, então A' é 

Se A é uma matriz diagonal, então A' = 

. Verdadeiro ou falso? 

a) A) = (A) 

b) (A +B) =B'+A 

c) Se AB = 0, então A = 0 ou B = 0. 

d) (kı A) (k2B) = (kı k2)AB 

e) (-A) (-B) = - (AB) 

f) Se A e B são matrizes simétricas, então AB = BA. 


g) Se A - B = 0, então B - A = Q. 
h) Se podemos efetuar o produto A + A, então A é uma matriz quadrada. 


E qu Da e 
; =A- A, então) 3 3| = 


. SeA é uma matriz triangular superior, então A? é 


x )]|2 3] |1 0 
Ache x, y, Z, w se É q É ARE HE 


1 -3 2 1 1 0 2 1 -1 -2 
. Dads A=|2 1 -3|,B=|2 1 1 1l1ļeC=|3 -2 1 -l 
4 -3 -1 1 -2 1 2 2 -5 -i 0 


mostre que AB = AC. , 


. Suponha que A + 0 e AB = AC onde A, B, C são matrizes tais que a multiplica- 


ção esteja definida. 
a) B=C? 
b) Se existir uma matriz Y, tal que YA = I, onde I é a matriz identidade, então 


B-C? 


. Explique por que, em geral, (A + BÝ £A? + 2AB + B? e (A + B)(A - B) + 
A? - B°. 


E Re -1 3 5 2 -2 -4 
“DadasA=|-1 4 5|, B=| 1 -3 -5|eC=|-1 3 4], 
1-3 4 -1 3 5 a: 
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a) Mostre que AB = BA = 0, AC = A e CA = C. 
b) Use os resultados de (a) para mostrar que ACB = CBA, A? c = 
= (A-B)(A+B) e (A BP =A? +B. 


4 3 


.Se A= E E ache B, de modo que B? = A. 


. Um construtor tem contratos para construir 3 estilos de casa: moderno, medi- 


terrâneo e colonial. A quantidade de material empregada em cada tipo de casa é 
dada pela matriz: 


Ferro Madeira Vidro Tinta Tijolo 
Moderno 5 20 16 7 17 
Mediterrâneo 7 18 12 9 21 
Colonial 6 25 8 5 13 


(Qualquer semelhança dos números com a realidade é mera coincidência.) 


a) Se ele vai construir 5,7 e 12 casas dos tipos moderno, mediterrâneo e colonial, 
respectivamente, quantas unidades de cada material serão empregadas? 

b) Suponha agora que os preços por unidade de ferro, madeira, vidro, tinta e ti- 
jolo sejam, respectivamente, 15, 8, 5, 1 e 10 u.c.p. Qual é o preço unitário 
de cada tipo de casa? 

c) Qual o custo total do material empregado? 


. Uma rede de comunicação tem cinco locais com transmissores de potências 


distintas. Estabelecemos que a; = 1, na matriz abaixo, significa que a 

estação i pode transmitir diretamente à estação j, aj; = O significa que a 
transmissão da estação i não alcança a estação j} Observe que a diagonal 
principal é nula significando que uma estação não transmite diretamente 


para si mesma. 


0 1 1d 


O =. O m m 
O ~ o o 


1l 
l 
0 
1 


O o O e 
o o - o m.e 


Qual seria o significado da matriz A? = A » A? 
5 
Seja A? = [c]. Calculemos o elemento caz = X aakākı = 0+0+1+0+0=1. 
k=1 
Note que a única parcela não nula veio de a4;* 43) = 1-1. Isto significa 
que a estação 4 transmite para a estação 2 através de uma retransmissão 
pela estação 3, embora não exista uma transmissão direta de 4 para 2. 
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a) Calcule A?. 

b) Qual o significado de c3 = 2? 

c) Discuta o significado dos termos nulos, iguais a 1 e maiores que 1 de 
modo a justificar a afirmação: “A matriz A? representa o número de 
caminhos disponíveis para se ir de uma estação a outra com uma única 
retransmissão”. 

d) Qual o significado das matrizes A + A?, A? e A + A? + A?? 

e) Se A fosse simétrica, o que significaria? 


17. Existem três marcas de automóveis disponíveis no mercado: o Jacaré, o 
Piranha e o Urubu. O termo a;; da matriz A abaixo é a probabilidade de 
que um dono de carro da linha i mude para o carro da coluna j, quando 
comprar um carro novo. 


Para 
J P U 


310,7 02 01 
De P|03 05 0,2 
U|04 04 0,2 


Os termos da diagonal dão a probabilidade a;; de se comprar um carro 
novo da mesma marca. 

A? representa as probabilidades de se mudar de uma marca para outra 
depois de duas compras. Você pode verificar isto a partir dos conceitos básicos 
de probabilidade (consulte 1.5) e produto de matrizes. 

Calcule A? e interprete. 


18. Tente descobrir outras situações concretas que possam ser analisadas de 
modo similar ao de cada um dos problemas 15, 16 e 17. 


* 1.5 PROCESSOS ALEATÓRIOS: CADEIAS DE MARKOV 


Muitos dos processos que ocorrem na natureza e na sociedade podem ser estu- 
dados (pelo menos em primeira aproximação) como se o fenômeno estudado 
passasse, a partir de um estado inicial, por uma sequência de estados, onde a 
transição de um determinado estado para o seguinte ocorreria segundo uma 
certa probabilidade. (Suporemos nesta secção um conhecimento mínimo sobre 
probabilidades.) No caso em que esta probabilidade de transição depende ape- 
nas do estado em que o fenômeno se encontra e do estado a seguir, O proces- 
so será chamado processo de Markov e uma sequência de estados seguindo 
este processo será denominada uma cadeia de Markov. Evidentemente, ao se 
supor tal restrição estaremos simplificando, talvez demasiadamente, uma vez 
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que as probabilidades podem se modificar com o tempo. Mas, assim mesmo, a 
informação que obtivermos com este modelo já nos servirá de auxílio para 
uma previsão do comportamento de certos fenômenos. 

Suponhamos, por exemplo, que, em uma determinada região, observa-se 
que se chover bastante durante um ano, a probabilidade de que chova bastante 


no ano seguinte é L , € que a probabilidade de que faça seca é de 4 . Ainda, 
se houver seca em um ano, no ano seguinte a probabilidade de haver seca ou 
chuva suficiente será a mesma, e igual a L. Suponhamos também, para simplificar 


(o que não ocorre na prática, embora possamos usar como recurso para ter um 
indicador da situação), que estas probabilidades não mudem com o decorrer do 
tempo. Os estados possíveis para este processo são: chuva e seca. 

Podemos ter, então, as seguintes seqüências de acontecimentos (árvore de 
probabilidades): 


Assim, sabendo que no primeiro ano houve seca, a probabilidade de que 


chova bastante no terceiro ano é 5 . 1 + + . z = Š . Conforme o número de 


anos aumenta, as contas se tornam mais complicadas e, se estivermos interessa- 
dos em previsões a longo prazo sobre o clima da região, temos que procurar 
um outro procedimento. Isto pode ser feito se introduzirmos a noção de matriz 
das probabilidades de transição, e a de vetor de probabilidades. A matriz T das 
probabilidades de transição é obtida da tabela de probabilidades onde o elemen- 
to na i-ésima linha e j-ésima coluna indica a probabilidade de transição do j-ési- 
mo para o iésimo estado. 
19 ano 29 ano 3º ano... 


4 
o 
L c ec saias C — chuva 
S S — seca 
o 
C 3 1 
2 3 E EN 
pill 4 Basa 
S 1 
+ 
e SS é dE 
1 + 
a Cs 
— r 
S 1 one 
1 S ~ + 
1 S&H Bibliotecas 
Figura 1.5.1. 2 Ciència & 


Pel 


\ 
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Aje jm 
nj tojm 


O vetor de probabilidades é a matriz 


p® 


p™ 


cuja primeira linha dá a probabilidade de que haja chuva no n-ésimo ano e a segunda 
linha dá a probabilidade de que haja seca no n-ésimo ano. 
Analisando a árvore de probabilidades vemos que 


Dl, 1,0) 
Pç = q Pe tP; 


DS) gtp 
p = DO + 
1 1 l l 
pol la 7) [po] [are +52 
Observamos que T. j° |= 3 il e |= 3 i 
Ro) E ERON O ERRO 
4 2 4e 2És 
e portanto i 
PE | |? 
po pe? 


t 


O mesmo ocorre do segundo para o terceiro ano, deste para o quarto etc. Temos, 
então, a sequência: 


1º ano 2º ano 3º ano 
ptb po) psd po p® S po) 
PESE RR RE 6 7 E (1) 
po po Ps Ps Ps Ps 
n-ésimo ano 
p® p® 
==> a 
pt? pé 
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Portanto, o comportamento do clima desta região a longo prazo (isto é, quando n 
aumenta) poderá ser previsto se soubermos que os elementos das matrizes T”, 
n=1,2,...se aproximam dos elementos de uma matriz fixa P pois, neste caso, 


p® — pı ep? — pa quandon —> > 


com 
Pi p{® 


P2 ptD 


(Tal previsão é importante, pois se chegarmos, por exemplo, à conclusão que 
py?) > 1 quando n > oo, a longo prazo a região se tornará um deserto.) 

Se T” não se aproxima de uma matriz P, então não poderemos fazer ne- 
nhuma previsão a longo prazo, pois o processo se modificará bastante a cada 
passo. Assim, um dos problemas que devemos resolver é quais são as condições 
sobre a matriz T das probabilidades de transição, para que suas potências se 
aproximem de uma determinada matriz. Antes de resolver isto, porém, vamos 
formalizar a situação anterior. 


1.5.1 Definição: Um processo aleatório de Markov é um processo que po- 
de assumir estados a,, à», ..., 4,, de tal modo que a probabilidade de transição 
de nã estado a; para um estado a; seja p;; (um número que só depende de a; 
e aj). 


A matriz das probabilidades de transição (matriz estocástica) é dada por: 


Pu Pn .-. Pir 

Pa Pn +... Par 
T= 

Pr Pn ... Pre 


(Observe que pj > O, e que a soma de cada coluna deve ser 1.) 
O vetor de probabilidades é aquele cuja i-ésima linha dá a probabilidade 
de ocorrência do estado a; após n transações: 


pr 


(n) 
r 
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Seguindo o raciocínio do exemplo anterior vemos que, após n passos, 
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O que este teorema nos diz é que se a matriz das probabilidades de tran- 
sição é regular, então é possível fazer previsão a longo prazo e esta não depen- 
de das probabilidades iniciais V,. Além disso, o item (iv) nos indicará como 
achar as probabilidades depois de um longo prazo. O processo utilizado para se 


(n) (1) : 
Pi Pi encontrar o vetor “final” de probabilidades, usando o item (iv), corresponde à 
ia procura de autovetor associado ao autovalor um da matriz T, segundo as deno- 
=T.): minações que veremos no Capítulo 6. Não faremos a prova deste teorema por- 

pt p» que isto nos desviará demais de nossos objetivos. 

1.5.5 Exemplos 
= = Exemplo 1: No problema sobre previsão de clima que estávamos estudan- 
1.5.2 Previsões a Longo Prazo: Para podermos fazer previues a longo | do na introdução, 
prazo, a matriz T deve cumprir certas condições. Assim, introduzimos a definição 


a seguir. 


1.5.3 Definição: Uma matriz das probabilidades de transição é regular se 
alguma de suas potências tem todos os elementos não nulos. 
A importância da matriz regular para as previsões a longo prazo é dada 


pelo teorema abaixo: é regular pois sua primeira potência, isto é, ela mesma, já tem todos os elemen- 


tos estritamente positivos; e assim podemos concluir, usando o item (iv), que 
quaisquer que sejam as probabilidades iniciais, as probabilidades a longo prazo 


1.5.4 Teorema: Se a matriz T, xp das probabilidades de transição é regular, são dadas por: 
então: 
f f 1 1 
i) As potências T” aproximam-se de uma matriz P, no sentido de que cada Pe 4 2| rp 
elemento de T” aproxima-se do elemento correspondente em P. [ “3 1 [> ] 
if) Todas as colunas de P são iguais, sendo dadas por um vetor-coluna 4 2 $ 
1 1 
Pı a Pe=GPct5 Ps 
V= : -2 41 
r , Ps =% Pe t3 Ps 
2p = 3 
com pı > 0, P2 > 0, Pr > 0. ou Ps Pe => P; =? p, 
iii) Para qualquer vetor de probabilidades inicial 2Ps = 3Pe 2 
pí) Como devemos ter pe + ps = 1 (que é a probabilidade total), temos pe +5 Pe = 
V, = 
l i) =1 ou Pe + e, portanto, ps =4 . Assim, a longo prazo a probabilidade de 
Pr 
um ano de chuva eż , enquanto que a probabilidade de um ano de seca é = 
(dentro das hipóteses simplificadoras), e portanto a região tenderá a uma ligeira 


o vetor de probabilidades T”V, aproxima-se de V (dado no item anterior). 


iv) O vetor V é o único vetor que satisfaz V = TV. aridez. 
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Exemplo 2: Suponhamos que em uma determinada região, a cada ano 
três por cento da população rural migra para as cidades, enquanto que apenas 
um por cento da população urbana migra para o meio rural. Se todas as de- 
mais condições permanecerem estáveis, as condições políticas não mudarem, e 
estas porcentagens de migração continuarem as mesmas, qual deve ser a relação 
entre as populações urbana e rural desta região a longo prazo? 

Como três por cento da população rural migra para o meio urbano, a 
probabilidade de migração do meio rural para o meio urbano é 0,03, enquanto 
que a probabilidade de não migração é 0,97. Como um por cento da população 
urbana migra para o meio rural a probabilidade de migração do meio urbano 
para o rural é 0,01 e a de não migração é 0,99. Denotando por U o meio ur- 
bano e por R o meio rural, temos a matriz das probabilidades de transição: 


R U 


U |003 0,99 


Como a matriz é regular, a longo prazo as probabilidades pg, de viver no meio 
rural, e py, de viver no meio urbano, devem satisfazer 


0,97 0.01 PR PR 


0,03 0,99 Py Py 


donde py = 3pr e, como devemos ter pr; t pr = 1, temos pp = 0,25 e 
py = 0,75. Ou seja, a longo prazo, e se não houver modificações nas tendênci- 


as de migração, teremos 25% da população no meio rural e 75% da população 
no meio urbano. 


Exemplo 3: Observa-se experimentalmente que, em condições naturais e 
sem ser submetida à pesca industrial, a quantidade de uma certa espécie de 
peixes varia da seguinte forma: se em um determinado ano a população dimi- 
nuiu, a probabilidade de que diminua ainda mais no ano seguinte é de 0,6 e, 
se em um determinado ano a população aumenta, a probabilidade de que dimi- 
nua no ano seguinte é de apenas 0,3. Entretanto, observa-se que sendo subme- 
tida à pesca industrial, quando a população aumenta num determinado ano, a 
probabilidade de que diminua no ano seguinte se altera para 0,5, enquanto que 
se a população diminui num ano, a probabilidade de que diminua no ano se- 
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guinte continua sendo de 0,6. Deseja-se saber como, a longo prazo, a pesca in- 
dustrial estará afetando os peixes dessa espécie, para ver se é necessário diminuir 
a intensidade de pesca ou se, ao contrário, é possível aumentá-la. 

Os estados deste processo são: diminuição da população (D) e aumento 
da população (A). Então, sem haver pesca industrial, a matriz de probabilidades 
de transição é 


Como é uma matriz regular, as probabilidades pp da população diminuir e p4 
da população aumentar a longo prazo são “dadas por 
4 


06 03]. PD] -| PD 
04 07 PA PA 


que, sendo resolvida (lembrando que pp + P4 = 1), fornece pp =: e Pa =F. 


Portanto, como a probabilidade de a população aumentar é maior, em condi- 
ções naturais, a espécie tem a sobrevivência razoavelmente garantida. Com a 


pesca industrial, a matriz se altera para 


Como é uma matriz regular, a longo prazo pp e py são dadas por 

0,6 0,5 A PD| -| Pp 

0,4 0,5 PA E PA 
Assim, temos Pp -5 epa = $. Como a probabilidade de a população dimi- 
nuir é maior, se a espécie for submetida à pesca industrial, sua sobrevivência 


será ameaçada e, portanto, a pesca deve ser diminuída. 


Exemplo 4: Duas substâncias distintas estão em contato e trocam íons de 
sódio entre si. Sabe-se (por dedução teórica, ou experimentação) que um íon 
de sódio do meio (1) tem probabilidade 0,7 de passar ao meio (2), enquanto 
que um íon de sódio que esteja no meio (2) tem probabilidade 0,1 de passar 
ao meio (1). Colocando-se dois moles de sódio no meio (1), quais serão as con- 
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meio (1) meio (2) 


Figura 1.5.2 


centrações de sódio em cada um dos meios, após um longo período de tempo? 
Os estados deste processo são: o íon está no meio (1) e o íon está no 
meio (2). A matriz de probabilidades de transição é: 


meio (1) meio (2) 
0,3 0,1 
0,7 0,9 


meio (1) 
meio (2) 


Sejam pı e pz as probabilidades de estar no meio (1) e (2), respectivamente. 
Então, inicialmente, quando todo o sódio foi colocado no meio (1), p? =le 
ph = 0. Como a matriz de probabilidades é regular, a longo prazo as proba- 
bilidades não dependem das probabilidades iniciais, e devem satisfazer 


03 01 Pp! [Pi 
07 09): [pi] gia 


Resolvendo (lembrando sempre que p, + pa = 1), temos p; 5 e pz T ; 


anan t PN RA | . 
Logo, as concentrações finais em cada meio são E 2 = 0,25 moles no meio 


(1) e - «2 = 1,75 moles no meio (2). 


1.5.6 Previsões em Genética: Com pequenas modificações das idéias usadas 
nos processos de Markov, podemos estudar vários problemas genéticos. Sabemos 
que o tipo mais simples de transmissão de herança genética é efetuado através 
de pares de genes, os quais podem ser ambos dominantes, recessivos, ou um 
dominante e outro recessivo. Chamemos G o gene dominante e g o gene reces- 
sivo. Um indivíduo será chamado dominante se tiver genes GG, híbrido se tiver 
genes Gg, e recessivo, caso os genes sejam gg. Um indivíduo herda os genes ao 
acaso, um deles de seu pai e o outro de sua mãe. Assim, nos vários tipos de 
cruzamento, temos probabilidades distintas de transmissão de herança genética. 
No caso de cruzamento de indivíduos dominantes teremos somente filhos de 
genótipos dominantes. 
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GG com probabilidade 1 
GG cruzado com GG —>——» Gg com probabilidade O 
gg com probabilidade O 


No caso de cruzamento de indivíduos recessivos, teremos: 


GG com probabilidade O 
gg cruzado com gg ——Gg com probabilidade O 
gg com probabilidade 1 


No caso do cruzamento de um indivíduo dominante com um recessivo, temos: 


GG com probabilidade O 
GG cruzado com gg =» Gg com probabilidade 1 
gg com probabilidade O 


No caso do cruzamento de um indivíduo dominante com um híbrido, temos: 


GG com probabilidade 0,5 
GG cruzado com Gg —— Gg com probabilidade 0,5 
gg com probabilidade O 


No caso recessivo e híbrido, temos: 


GG com probabilidade O 
gg cruzado com Gg — Gg com probabilidade 0,5 
gg com probabilidade 0,5 


E finalmente, no caso de dois indivíduos híbridos, temos: 


GG com probabilidade 0,25 
Gg cruzado com Gg —— Gg com probabilidade 0,5 
gg com probabilidade 0,25 


Denotando por d, dominante, r, recessivo e A, híbrido, e os respectivos cruza- 
mentos por d X d, d X r etc., colocando as probabilidades em colunas, pode- 
mos montar a seguinte matriz T: 


dXd rXr dXr dXh rXh hxh 
d 1 0 0 0,5 0 0,25 
h 0 0 1 0,5 0,5 0,5 
r 0 1 o 0 0,5 0,25 


Biblioteca d \ 
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Além disso, numa população numerosa composta por uma porcentagem 
py” de indivíduos de características dominantes, pf de indivíduos híbridos e 


p{® de indivíduos de características recessivas, a probabilidade de cruzamento 
de genes de um indivíduo dominante com outro dominante é pp . pP. Se 


quizermos calcular a probabilidade de um cruzamento onde um dos indivíduos 
é dominante e o outro é híbrido, temos que somar pẹ? - pf” (considerando 
que o primeiro é dominante e o segundo é híbrido) a pp « pP. Assim, a 
probabilidade é de 209 . PÁD. Os outros casos seguem o mesmo raciocínio e 
temos então: 


Cruzamento Probabilidade 


(Estamos supondo que a característica genética analisada seja tal que não inter- 
fira no cruzamento natural.) 
Então, podemos ter as porcentagens de indivíduos dominantes, PP, de 


indivíduos híbridos, pj?), e de indivíduos recessivos, p!?, da segunda geração, 
multiplicando as matrizes: 


pp a pp 


a, 0) 
pP| f1 0005 0 025 Pr > Pr 


290) > p0) 
pPl-[0 0105 0,5 05 Pa) + Pr 

29 . pt) 
p®| |lo1 0 0 05 0,25 pa + Ph 

2p{® «pf 


pf? . {D 


Supondo que não haja novo cruzamento de individuos da primeira gera- 
ção (o que, em geral, ocorre com populações de insetos etc.), uma vez obtidas 
as porcentagens de indivíduos da segunda geração, podemos obter as porcenta- 
gens da terceira geração, multiplicando novamente a matriz T pelos novos da- 
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dos, e assim sucessivamente. Dessa forma, obtemos o perfil genético de qualquer 
geração. Evidentemente, os cálculos tornam-se demorados, mas podem ser feitos 
facilmente, se usarmos calculadoras. Este tipo de análise é muito simples (de- 
mais talvez), mas é importante em muitos campos, como em Agricultura, para 
se ter uma idéia da propagação da resistência genética a certos tipos de doença, 
da resistência de insetos a tipos de inseticidas etc. 


Exemplo: Aplica-se um certo tipo de inseticida em uma plantação, 
para se combater uma determinada espécie de insetos. Após a aplicação verifi- 
ca-se que, dos poucos insetos sobreviventes, 60% eram resistentes ao inseticida 
e os outros 40% não o eram (e haviam sobrevivido por razões casuais). Sabe-se 
que o ciclo de vida desses insetos é de um ano e que eles se cruzam apenas 
uma vez em cada geração. Além disso, ficou comprovada que a resistência ao 
inseticida é uma característica dominante e que o inseticida não foi aplicado 
novamente. Tendo estes dados em mente, perguntamos qual é a porcentagem 
de insetos resistentes ao inseticida após dois anos? 

Como a resistência é uma característica dominante, os insetos resistentes 
podem ter genótipo GG ou Gg na relação 1:2, e assim, 20% dos insetos resis- 
tentes são dominantes e 40% são híbridos. Temos, portanto, py? = 0,2, py = 
=04€e po = 0,4 e assim, a distribuição da porcentagem dos insetos após um 
ano é dada por 


(0,2) - (0,2) 

3 (0,4) + (0,4) 
p 1 0 0 05 0 025 240,2) . (0.4) 
pe|=|o 0 1 05 05 05 |. | 20.2) - (0,4) 
2(0.4) - (0,4) 

0O 1 0 0 05 025 (0,4) - (04) 


ou seja, pP = 0,16, pf? = 0,48 e pé? = 0,36. Após mais um ano, a distribui- 
ção de insetos será dada por 


(0,16) (0,16) 
(0,36) (0,36) 


G) 
py 10 0 05 0 025) | 3016) (0,36) 


pPl=|[0 o 1 05 05 05 20,16) (0,48) 
2(0,36) (0,48) 
p® O 1 © 0 05 0,25 (0,48) (0,48) 


ou seja, p = 0.16, pp? = 0,48 e p{® = 0,36. Assim, após dois anos, a por- 
centagem dos insetos resistentes ao inseticida será pP + pP = 0.16 + 0,48 = 
= 0,64, ou seja, 64% da população é resistente. Dessa forma, se for necessária 
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uma nova aplicação de inseticida, não será conveniente aplicar o mesmo tipo, 
pois ele matará no máximo 36% do insetos. 


Observe que a distribuição dos insetos quanto ao genótipo GG, Gg ou gg 
permaneceu a mesma na segunda e terceira gerações. pP = pP = 0,16 
pi = pi? = 0,48 e pf? = p® = 036.) 

Calcule as probabilidades para a quarta geração de insetos (depois de três 
anos). O resultado que você obteve não é uma casualidade. Existe uma “lei ge- 
nética” muito conhecida, que estabelece sob condições ideais que depois da se- 
gunda geração, a distribuição entre os genótipos permanece a mesma. Assim, se 
partirmos de uma população onde a formação inicial é dada por frequências 


pP =u, pP =ve pi = w, temos: 


Você pode mostrar esta relação através do produto de matrizes. 

No “modelo genético” considerado neste parágrafo, é assumida uma situa- 
ção-padrão: não existe migração, os encontros são ao acaso, não ocorrem muta- 
ções nem seleção, os dois sexos aparecem sempre em quantidades iguais. 

Esta relação de estabilidade genética aqui apresentada foi mostrada inde- 
pendentemente, pelo matemático G. H. Hardy e o genético W. Weinberg em 


1908. 


* 1.6 EXERCÍCIOS 


1. Suponha que um corretor da Bolsa de Valores faça um pedido para comprar 
ações na segunda-feira, como segue: 400 quotas de ação A, 500 quotas da 
ação B e 600 quotas da ação C. As ações A, B e C custam por quota 
Cr$ 500,00, Cr$ 400,00 e Cr$ 250,00, respectivamente. 


a) Encontre o custo total de ações, usando multiplicação de matrizes. 
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b) Qual será o ganho ou a perda quando as ações forem vendidas seis meses 
mais tarde se as ações A, Be C custam Cr$ 600,00, Cr$ 350,00 e 
Cr$ 300,00 por quota, respectivamente”? 


. É observado que as probabilidades de um time de futebol ganhar, perder e 


empatar uma partida depois de conseguir uma vitória são — $ e io respec- 


tivamente; e depois de ser derrotado são E $ 5 e Z, respectivamente; e 
depois de empatar são + os es , respectivamente. Se o time não melhorar 


nem piorar, conseguirá mais vitórias que derrotas a longo prazo? 


. Numa pesquisa procura-se estabelecer uma correlação entre os níveis de esco- 


laridade de pais e filhos. Estabelecendo as letras P para os que concluíram o 
curso primário, S para O curso secundário e U para O curso universitário, a 
probabilidade de um filho pertencer a um destes grupos, dependendo do gru- 
po em que o pai está é dada pela matriz 


P S U 
2 oq 
Eu eo O 
l 1 1 
Go 3 53 
1 2 
Unas 


Qual é a probabilidade de um neto de um indivíduo que realizou o curso 
secundário ser um universitário? 


. Numa cidade industrial, os dados sobre a qualidade do ar são classificados 


como satisfatório (S) e insatisfatório (I). Assuma que, se num dia é registrado 
S, a probabilidade de se ter S no dia seguinte é de Z e que, uma vez regis- 
trado I, tem-se + de probabilidade de ocorrer S no dia seguinte. 


a) Qual é a probabilidade do quarto dia ser S, se o primeiro dia é I? 
b) O que se pode dizer a longo prazo sobre a probabilidade de termos dias 
S ou P 


. Numa ilha maravilhosa verificou-se que a cor azul ocorre em borboletas de 


genótipo aa, e não ocorre em Aa e AA. Suponha que a proporção de bor- 
boletas azuis seja 4 . Depois de algumas gerações, qual será a porcentagem 


das borboletas não azuis, mas capazes de ter filhotes azuis? 
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1.7 RESPOSTAS 


1.7.1 Respostas de 1.4 


2.x=1 
4. Triangular inferior 
6.a) V; b) V; DF d) V; DF DF E; AV 
8. Triangular superior 
12. Porque em geral o produto de matrizes não é comutativo. 
15. a) [146 526 260 158 388] 
492 
b) |528 
465 
c) Cr$ 11.736,00 
16.a) |1 1 2 3 1 
0 2 2 2 2 
1 O 2 i I 
0 1020 
0 0O 1 01 
17. 0,59 0,28 0,13 


0,44 039 0,17 
0,48 0,36 0,16 


1.7.2 Respostas de 1.6 


2. As probabilidades de ganhar, perder ou empatar, a longo prazo, são aproxi- 


madamente iguais a 1/3, sendo a probabilidade de ganhar ligeiramente maior. 


3. A probabilidade é 1/3. 
4. a) 31/125 l 
b) A longo prazo, a probabilidade de termos dias satisfatórios é 1/4 e de 
termos dias insatisfatórios é 3/4. 
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SISTEMAS DE EQUAÇÕES 
LINEARES 


2.1 INTRODUÇÃO 


Na natureza, as coisas estão sempre mudando, se transformando, e o ser huma- 
no, para garantir sua sobrevivência e melhorar sua existência, precisa conhecer 

e dominar estes processos de mudança. Um dos métodos encontrados para se 
descrever estas transformações foi o de procurar nestas o que permanece cons- 
tante durante a mudança. Por exemplo, sabemos que o hidrogênio (H,) reage 
com o oxigênio (0,) para produzir água (H,0). Mas, quanto de hidrogênio e 
de oxigênio precisamos? Esta é uma mudança que podemos descrever do seguin- 
te modo: x moléculas de H, reagem com y moléculas de O, produzindo z mo- 
léculas de H20, ou esquematicamente: 


xH, + y0, — zH,0. 


O que permanece constante nessa mudança? Como os átomos não são 
modificados, o número de átomos de cada elemento no início da reação deve 
ser igual ao número de átomos desse mesmo elemento, no fim da reação. Assim, 
para o hidrogênio devemos ter 2x = 2z, e para o oxigênio, 2y = Z. Portanto, as 
as nossas incógnitas x, y e z devem satisfazer as equações: 


2x - 2z 
2y - 2 


0 
0 
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Se conseguirmos descobrir quais são os números x, y, z que satisfazem simul- 
taneamente estas relações, teremos aprendido um pouco mais sobre como se 
comporta a natureza. 

Este procedimento que consiste em identificarmos o que permanece cons- 
tante na mudança, leva a um sistema de equações que precisa ser resolvido e, 
em muitos casos, as equações envolvidas são lineares (como no exemplo ante- 
rior da reação de H} com O2). Evidentemente, você já sabe um pouco como 
resolver este tipo de sistema, mas quando o número de equações se torna muito 
grande, ou temos menos equações do que incógnitas (como no caso anterior), 
podem surgir muitas dúvidas, até mesmo sobre a existência ou não de solução 
para O sistema. l 

Por outro lado, em sistemas que apresentam mais do que uma solução é 
necessário ter-se uma forma clara de se expressar todas elas. Por exemplo, no 
sistema anterior você pode encontrar duas soluções distintas para (x, y, z) 
(faça isto!), mas só o terá resolvido se conseguir expressar o conjunto de todas 
as soluções. Por isso, nosso objetivo neste capítulo é estudar um método para 
a resolução de sistemas lineares em geral. A técnica que será utilizada pode não 
ser a melhor no caso de sistemas muito simples, mas tem a vantagem de poder 
ser aplicada sempre e ser facilmente mecanizada. É particularmente útil em sis- 
temas com grande número de incógnitas onde o uso de calculadoras é inevitá- 
vel. Em síntese, este método consiste em substituir o sistema inicial por siste- 
mas cada vez mais simples, sempre “equivalentes” ao original. 

Comecemos com o seguinte exemplo. (Para efeito de visualização, coloca- 
remos ao lado de cada sistema uma matriz a ele associada.) 


Xı + 4x, + 3x3 =1 (1) 1 4 3 1 
(1) 2x1 + 5x, + 4x3 =4 (2) 2 5 4 4 
Xi = 3x, - 2x3 = 5 (3) 1 -3 ~2 5 


1º Passo: Eliminamos x, das equações (2) e (3). Para isto, multiplicamos a 
equação (1) por -2 e somamos a equação obtida com a equação (2), obtendo 
uma nova equação (2). Da mesma maneira produziremos a equação (3, obti- 
da ao multiplicarmos a equação (1) por -1, somando esta nova equação à equa- 
ção (3). Isto resulta no seguinte sistema: 


X1 + 4x, + 3x3 = 1 (19 1 4 3 1 
(I) 40x, - 3x3 - 2x3 = 2 (2) 03 22 
Ox, - 7x, -5x3=4 (3) 0 -7 -5 4 
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2º Passo: Tornamos o coeficiente de x, da equação (2') igual a 1, Para isto, 
multiplicamos a equação (2') por -1/3. O sistema resultante é: 


x1+4%+3x=1 a”) 1 4 3 1 

2 2 , 2 
(I) $ 0x, + X + Sx3=-S (2”) 0 i $ -2 
Ox, - 1x3 - 5x3 =4 (3) 0 -7 -5 4 


3º Passo: Eliminamos x, das equações (1”) e (3”). Para isto, multiplicamos a 

equação (2") por -4 e somamos a esta a equação (1), obtendo (1). De ma- 
neira análoga obtemos (3), multiplicando a equação (2”) por 7 e somando a 
esta nova equação a equação (3"). 


x +0 tis DS a 10 545 

2 2 "e 2 2 

(IV) Ox, + X, + 3 *3 = T7 (2 ) 0 l 3 “3 
1 2 m 1 2 

0x, + 0x, - 7 %3 = -7 (3 ) 0 0 =F -3 


4º Passo: Tornamos o coeficiente de x; na equação (3) igual a 1. Para isto, 


multiplicamos a equação (3º ) por -3. Isto resulta no seguinte sistema: 


1 1 Ñ 1 l1 

x, + 0x, + 3X y (1”) 1 0 3 3 

2 2 Í 2 2 

(V) Ox, + x, + ERE ET (2) 01 7 -5 


0x + 0x, + x3=2 (3*5) 0012 


5º Passo: Eliminamos x, das duas primeiras equações do sistema V. Multiplica- 
mos a equação (3”) por -1/3 e somamos a esta nova equação a equação (1º). 
De modo análogo, multiplicamos a equação (3™) por -2/3 e a esta nova equa- 
ção somamos a equação (2”). Sistema resultante: 


Xi + 0x, + Ox 3 = 3 1 0 0 3 
(IV) Ox, + Xa + 0x3 = -2 0 1 0 o. 
Ox, + Ox, + x3 = 2 0 01 2 
ou ainda: 
X1 = 3 
E 7 edi 
NOZA Beaia 


UFPel 
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Assim, cada sistema foi obtido a partir do sistema anterior, por “opera- 
ções” que preservaram as igualdades. Por isto, cada terna (X,, X2, X3) que é so- 
lução do sistema I, também será solução dos sistemas seguintes. Deste modo, 
uma vez encontradas as soluções do sistema VI, as soluções do sistema Í, se 
existirem devem estar entre estas, isto é, toda solução do sistema I também é 
solução do sistema VI. 

O ponto fundamental deste procedimento é que as etapas são todas re- 
versíveis. Por exemplo, partindo do sistema II podemos obter o sistema I, da 
seguinte maneira: ; 

(D)= (1) 


MD=2:(0)+4(02) 
(3) = (19 +13) 


(Com esta notação estamos querendo indicar que, por exemplo, a segunda linha 
(2) do sistema I é obtida multiplicando-se por dois a primeira linha (1') do sis- 
tema II e somando-se a segunda linha (2') do sistema II, isto é, (2) = 2 - 
- (1°) +(2).) 

De modo análogo, você pode obter o sistema V a partir de VI, IV a par- 
tir de V, I a partir de IV e ll a partir de IlI. Usando o mesmo argumento 
anterior, podemos dizer que toda solução de VI também é solução de I. A par- 
tir das duas afirmações destacadas acima concluímos que os sistemas I, II, II, 
IV, V e VI têm as mesmas soluções e, portanto, x, = 3, x3 = -2 e x; = 2, 
que é a solução de VI, é a única solução do sistema inicial I. (Você pode ve- 
nficar por substituição direta, que esta é uma solução, mas apenas como ga- 
rantia de que não erramos nos cálculos.) 

Podemos afirmar que no exemplo anterior os sistemas I, II, III, IV, V e 
VI são equivalentes segundo a definição dada a seguir. 

Observe que, no exemplo anterior, as únicas operações que efetuamos 
são dos seguintes tipos: 


i) Multiplicar uma equação por um número diferente de zero. 
ii) Adicionar a equação a outra. 


Existe ainda uma outra operação que às vezes precisaremos efetuar neste 


procedimento, e ela também é reversível. 
iii) Permutar duas equações. 


Por exemplo, no sistema: 


| 
tn 
~ 
Em 
Nr” 


Xz + 3x3 = 
X1 + 3x, + X3 = 2 (2) 
2x, + 4x, — X3 


ll 
m 
a 
ta 
e? 
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nosso primeiro passo seria permutar as equações (1) e (2), de modo a obter o 
coeficiente de x, diferente de zero na primeira equação. 

Estas operações num sistema produzem sempre sistemas com mesmo 
conjunto-solução, como vimos no exemplo anterior. Uma demonstração formal 
deste fato, usando matrizes elementares, será vista em 3.8.5. Agora iremos usar 
matrizes para apresentar uma maneira organizada de resolver sistemas de equa- 
ções, seguindo a idéia do exemplo anterior. Antes, porém, vamos formalizar 
alguns conceitos. 


2.2 SISTEMAS E MATRIZES 


2.2.1 Conceitos 
Um sistema de equações lineares com m equações e n incógnitas é um conjunto 
de equações do tipo: 
G,1X1 + EX PT aro + CinXn = b; 
aX; tank +... tn = bo 
(+) 


UmiX1 + UmaX + tmn = bm 


com ai, 1 Si <m, 1 Sj <n, números reais (ou complexos). 
Uma solução do sistema (*) é uma n-upla de números (X1, X2, ...» Xn) 
que satisfaça simultaneamente estas m equações. 


Dois sistemas de equações lineares são equivalentes se, e somente se toda 
solução de qualquer um dos sistemas também é solução do outro. 


2.2.2 Sistemas e Matrizes 
Podemos escrever o sistema (*) numa forma matricial: 


Qu 12 -~ lin Xi b; 
dy an œ an x db, 
am Im amn Xn bm 


ou À - X= B onde 
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é a matriz dos coeficientes, 


a matriz dos termos independentes. 


Uma outra matriz que podemos associar ao sistema é 


an EU) ES ain b, 
z &22 Gn b 


Im Im Im bm 


que chamamos matriz ampliada do sistema, Cada linha desta matriz é simples- 
mente uma representação abreviada da equação correspondente no sistema. 
Observe que no exemplo dado em 2.1, ao lado de cada sistema, escrevemos sua 


matriz ampliada. Assim, no sistema dado: 


— 


x, + 4x, t 3x3 = 
2x, + 5x2 + 4x3 =4 


Xi e 3x2 - 2x3 = 5 
temos a forma matricial 
1 4 3 Xı 1 
5 4 X% | = 4 
1 -3 2 X3 5 


Em termos de matrizes ampliadas, na resolução do sistema, partimos de 


1 4 3 1 
5 4 4 
1 -3 -2 5 
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e chegamos a 


1 0 0 3 
O 1 0 -2 
0 0 1 2 
que é a matriz ampliada do sistema VI 
Xi = 3 
X}, = -2 
X3 = 2 


através de operações equivalentes às efetuadas nas equações dos sistemas. Estas 
que serão definidas a seguir são as operações elementares sobre as linhas de 
uma matriz. 


2.3 OPERAÇÕES ELEMENTARES 
São três as operações elementares sobre as linhas de uma matriz. 


i) Permuta das i-ésima e j-ésima linhas. (L; — L;) 


Exemplo: Lı — L3 


1 0 1 0 
4 dio: 4 
-3 4 4 -i 


ii) Multiplicação da iésima linha por um escalar não nulo k. (L; —> kL;) 


Exemplo: Lı —» -3L, 


1 0 1 0 
4 -1|j-—— |-12 3 
-3 4 -3 4 


iii) Substituição da i-ésima linha pela iésima linha mais k vezes a j-ésima li- 
nha. (L; — L; + kL;) 


Exemplo: L; — L, + 2L, 


l 0 1 0 
4 -l |—ļ| 4 -l 
-3 4 -1 4 


36 ÁLGEBRA LINEAR 


Se A e B são matrizes m X n, dizemos que B é linha equivalente a A, se B 
for obtida de A através de um número finito de operações elementares sobre 
as linhas de A. Notações: A > B ou A ~ B. 


Por exemplo, 
1 0 1 0 
4 -1 | é linha equivalente a {O 1f, pois 
-3 4 0 0 
1 0 1 0 
DEN >L -4L “| L3>L3+3L 
-3 L >L 1) 3 4| tab 1 
1 0 1 0 1 0 
O dl>-—— + [0 1| —— |0 1 
0 L;)>-iLs 0 4 Lao L3-4L; 0 0 


Já comentamos em 2.1 que as operações com linhas de um sistema pro- 
duzem outro sistema equivalente ao inicial. Em termos de matrizes, podemos 


enunciar este resultado como: 


2.3.1 Teorema: Dois sistemas que possuem matrizes ampliadas equivalentes 
são equivalentes. 


(A demonstração deste teorema, usando-se matrizes elementares, está em 
3.85.) 
Como vimos, o processo utilizado para se resolver sistemas por “elimina- 
ção de incógnitas” corresponde a passar a matriz ampliada do sistema inicial 
para matrizes-linha equivalentes a esta, até que cheguemos a uma matriz conve- 
niente que indique a solução do sistema original. Você pode observar em 2.2. 
que a matriz final (associada ao sistema VI) tem uma forma especial. Ela é um 
exemplo do que chamaremos matriz-linha reduzida à forma escada. O método 
que apresentamos aqui consiste em obter por linha-redução estas matrizes, por 
meio das quais chegamos à solução do sistema de uma forma explícita. 

Um outro método, conhecido como o Método de Gauss, reduz por linha- 
equivalência a matriz ampliada do sistema a uma matriz “triangular”. (Você te- 
rá a oportunidade de resolver sistemas por este método, que é muito usado por 
suas vantagens computacionais, no Exercício 17 de 2.6. Não perca!) 
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2.4 FORMA ESCADA 


2.4.1 Definição: Uma matriz m X n é linha reduzida à forma escada se 

a) O primeiro elemento não nulo de uma linha não nula é 1. 

b) Cada coluna que contém o primeiro elemento não nulo de alguma linha tem 
todos os seus outros elementos iguais a zero. 

c) Toda linha nula ocorre abaixo de todas as linhas não nulas (isto é, daquelas 
que possuem pelo menos um elemento não nulo). 

d) Se as linhas 1, ..., r são as linhas não nulas, e se O primeiro elemento não 
nulo da linha i ocorre na coluna ki, então ky < kg <... < kp. 


Esta última condição impõe a forma escada à matriz: 


f 


Figura 2.4.1 
Isto é, o número de zeros precedendo o primeiro elemento não nulo de 
uma linha aumenta a cada linha, até que sobrem somente linhas nulas, se hou- 


ver. 


2.4.2 Exemplos 


1 0 0 0 n 

iommi £ o 1 1 0 Não é a forma escada pois a segunda 
00 10 condição não é satisfeita. 
0 2 a 

Exemplo 2: 1 0 3 Não é a forma escada pois não satisfaz a 
o0 o0 primeira e a quarta condições. 
0 1 -3 0 1I - f 

Exemplo 3: o o o o Q| Não satisfaz a primeira nem a 
00 019 terceira condição. 
© 1 -3 0 2 a : 

Exemplo 4: 00 012 E a forma escada pois todas as 
00 000 condições são satisfeitas. 
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2.4.3 Teorema: Toda matriz Amxn é linha equivalente a uma única ma- 
triz-linha reduzida à forma escada. 


Para a demonstração, veja a secção 2.7. Este teorema permite-nos definir 
os conceitos abaixo que serão relacionados a seguir com o número real de equa- 
ções e o número de soluções de um sistema, 


2.4.4 Definição: Dada uma matriz Amxn, seja By xn a matriz-linha re- 
duzida à forma escada linha equivalente a A. O posto de A, denotado por p, é 
o número de linhas não nulas de B. A nulidade de A é o número n - p. 


Observamos que dada uma matriz A qualquer, para achar seu posto neces- 
sitamos encontrar primeiro sua matriz-linha reduzida à forma escada, e depois 
contar suas linhas não nulas. Este número é o posto de A. A nulidade é a di- 
ferença entre colunas de A e o posto. 


2.4.5 Exemplos 


Exemplo 1: Desejamos encontrar o posto e a nulidade de A, onde 


2 1 0 
A =| -l 0 3 5 
1 -2 1 1 


1210 1 210 1 210 
+ 0 3 spa o 2 4 5|—jo 1.2 + pe 
1 -2 1 1 0 -4 01 TE 
fe. 0 0 -2 
1 0 -3 -5 1 0 -3 -5 5 
5 5 1 
01 Sisloi1 2 S>l0 10 -À 
oo 11 11 i1 
G oO 


O posto de A é 3 e a nulidade de A é 4-3 = 1. 
Observação: Se interpretarmos a matriz A dada acima como sendo a matriz 
ampliada de um sistema linear, teremos: 
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xi +2x + x3=0 
-Xi + Ox, + 3x3 =5 
xXx - 2% + x3=1 


A matriz-linha reduzida à forma escada é linha equivalente à matriz A. Assim 
$ $ 
o sistema que ela representa: 


X 


X2 


= |= æ]~ 


X3 


œ|z 


é equivalente ao sistema inicial, possuindo a mesma solução que este. 


Exemplo 2: Desejamos encontrar o posto e a nulidade de B, onde 


2 -1 3 

1 4 2 
B- l1 -5 1 
4 16 8 


Assim, efetuamos as seguintes operações matriciais: 


3 a 3 l 4 2 l 4 2 
1 4 2|_ |2 -1 3 0 -9 1 
Das q 1o -5 ESTO 3 a| 
4 16 8 4 16 8 0o o0 
142 ı Dr ae 
l 
no ales i ia 
E 00 0 
00 0 


O posto de B é 2, e a nulidade é 1, Repare que a matriz 


|2 -1 3 
B-l 4 J 
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tem o mesmo posto e nulidade que B. 
Reinterpretando as matrizes acima como sistemas de equações, diremos 
que o sistema de quatro equações associado à matriz inicial: 


[S] 
= 
| 


é equivalente ao sistema de duas equações: 


14 

+ = 
x + 0y 9 
Ox + au 
Ea 


associado à matriz-linha reduzida à forma escada. Este é um caso de sistema 
com equações redundantes. A terceira e a quarta equações (que se tornam nu- 
las no final do processo) podem ser desprezadas. Isto significa que o sistema 
inicial é equivalente ao sistema: 


Ee 
1 
de 
po 
N Go 


x +4y 


associado à matriz B,. 


Usamos dizer também que, neste caso, as duas primeiras equações são 
“independentes” e que as demais são “dependentes” destas. Você vai se fami- 
liarizar com estas denominações no Capítulo 4. Ainda segundo esta terminolo- 
gia, denominamos posto de uma matriz ao número de linhas “independentes” 
desta. Você pode observar que uma linha será “dependente” de outras (isto é, 
será igual a zero no final do processo de redução) se ela puder ser escrita co- 
mo soma de produtos destas outras linhas por constantes. Costumamos dizer 
também que esta linha é uma combinação linear das outras. Por exemplo, na 
matriz B podemos dizer que a primeira e a segunda linhas são independentes, 
enquanto que a terceira e a quarta são combinações lineares das duas primeiras 
linhas. 

Você viu assim que um posto da matriz ampliada de um sistema nos dá o 
número de equações independentes deste. Na próxima secção veremos que o 
posto também está relacionado com o número de soluções de um sistema. 
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2.5 SOLUÇÕES DE UM SISTEMA DE EQUAÇÕES LINEARES 


O objetivo desta secção é estudar detalhadamente todas as situações que po- 
dem ocorrer na resolução de um sistema linear. 


2.5.1 Se tivermos um sistema de uma equação e uma incógnita 


= ax = b 
existirão três possibilidades: 


i) a #0. Neste caso a equação tem uma única solução 


x =— 
a 


ü) a= 0e b= 0. Então temos Ox = 0 e qualquer número real será solução 
da equação. 


ii) a= 0 eb +0. Temos Ox = b. Não existe solução para esta equação. 


Para analisar sistemas de duas equações e duas incógnitas, vejamos alguns 
exemplos. 


2.5.2 Exemplos 


Exemplo 1: 
2x + x =5 


Xi - 3X = 6 


Lembramos que o conjunto de pontos (x1, x)) ER X R, que satisfaz cada 
equação deste sistema, representa uma reta no plano. Para resolver este sistema 
devemos então encontrar os pontos comuns a estas duas retas. 


X2 


(3, -1) 


Figura 2.5.1 


Deste modo, (3, -1) é a única solução, A matriz ampliada do sistema é 


2 1/5 
| 1 3 Al Transformando-a em matriz-linha reduzida à forma escada, 
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obtemos i A | que é a matriz ampliada do sistema 


Xi s73 
X, = -l 


i úni ã =3€e 
equivalente ao sistema inicial. O sistema tem uma única solução X1 


i i i sto da matriz 
x, = -1, como foi analisado graficamente. Observamos que O po 


E 1 0 ; iada 
dos coeficientes do sistema reduzido E E] e o da matriz amplia 


1 0 Sis 
0O 1 -l 


Exemplo 2: 


t 


2x, + X = 5 
6x, + 3x, = 15 


As duas retas que formam este sistema são coincidentes. 


X2 


x 


Figura 2.5.2 
que qualquer ponto de uma das retas é 


i te 
Neste caso, vemos geometricamente q ' i e 
solução deste sistema. A matriz ampliada do sistema e a matriz reduzida por 


linhas à forma escada são: 


t 
21 gjej za 
6 3 15 00 


Portanto, o sistema acima é equivalente ao sistema 


u 


a) o/a 


l 
X) + 3% 


Ox, + Ox, 


n 
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onde a segunda equação pode ser simplesmente “ignorada”, pois não estabelece 
nenhuma condição sobre x, ou x,. Ela é verdadeira para quaisquer números X; 
e x2. O conjunto de soluções deste sistema será dado, atribuindo-se valores 


arbitrários para a incógnita x, e tomando x, = 5 - 4- x}. Assim, para x% = À 
temos: 
5 l 
X, = — - — 
t 3 7 A 
Xa = A 


Atribuindo diversos valores para A, obtemos várias soluções para o sistema. Por 


exemplo, para À = O, temos x, = 5 e xı = 0. Para A = 1, temos xy =2e 


x, = 1 etc. Este sistema admite infinitas soluções. 

Observe que a matriz ampliada e também a matriz dos coeficientes do 
sistema têm posto 1, pois, uma vez transformadas em matrizes-linha reduzidas 
na forma escada, elas possuem uma linha não nula. A nulidade da matriz dos 
coeficientes é 2 - 1 = 1 que é também chamada o grau de liberdade do siste- 
ma. Isto quer dizer que o nosso sistema apresenta uma variável livre. 


Exemplo 3: 


2x, + X, = 
6x, + 3x, 


10 


Geometricamente, temos duas retas no plano que não possuem nenhum ponto 
em comum, pois são paralelas, e portanto este sistema não tem solução. Isto é 
mostrado na Figura 2.5.3, 


X2 


x 


Figura 2.5.3 


A niatriz ampliada deste sistema f ; o é equivalente à matriz-linha re- 


duzida à forma escada 


A 
2 
01 
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Portanto, o sistema inicial é equivalente a 


0 
l 


Ox, + Ox, 


ou x, capaz de satisfazer a segunda equação. 
lução. Dizemos que ele é incompatível (im- 
liada, reduzidas à 


Não existe nenhum valor de xı 

Assim, o sistema inicial não tem so 

possível). Vamos comparar à matriz de coeficientes e a amp 
forma escada do sistema 

1 1 

1 Vê ks 0 

0 0 0 0 1 


Observe que o posto da matriz dos coeficientes do sistema inicial é 1 e o pos- 


to de sua matriz ampliada é 2. 


2.5.3 Caso Geral: Consideremos um sistema de m equações lineares com 7” 


incógnitas X1, -..» Xn- 


anX tank + tainn = b, 


amiXı t AmaXa * + mnÝn = bm 


cujos coeficientes a;j e termos constantes b; são números reais (ou complexos). 


Este sistema poderá ter 


i) uma única solução: 


ii) infinitas soluções 
iii) nenhuma solução. 


No primeiro caso, dizemos que O sistema é poss 
No segundo caso, dizemos que O sistema é possível e indeterminado. E no ter- 
ceiro caso, dizemos que o sistema é impossível (incompatível). 

Consideremos a matriz ampliada do sistema anterior e tomemos sua ma- 


triz linha reduzida à forma escada: 


ível (compatível) e determinado. 


ai dies 


em es dp Cgi cid i a 


iso printer 


Sistemas de Equações Lineares 45 


mx(n+1) 


P : 
a F an e RRP (veja a secção 2.7) cada uma das afirma- 
ixo. Leia com atenção e 
volte aos exem 
2.5.2, se achar conveniente. A 


2.5.4 Teorema 


i) Um si õ i i 
) sa Eis m equações e n incógnitas admite solução se, e somente 
p a matriz ampliada é igual ao posto da matriz dos coeficientes. 


ü , A 
i) Se as duas matrizes têm o mesmo posto p e p = n, a solução será única 


i . z 
ï) Se as duas matrizes têm o mesmo posto p e p < n, podemos escolher 
Re Re Ru 
p incógnitas, e as outras p incógnitas serão dadas em função destas 


Para finalizarmos este assunt śm i 

i o, convém ilustrá-lo. Dize ii 

o grau de liberdade do sistema é n - p. Hate 
Em cada exemplo, é dada a matriz-li ida à 

, l ; z-Jinha reduzida à form 

triz ampliada. Usamos a notação ia 
Pe = posto da matriz dos coeficientes e 
pa = posto da matriz ampliada. Se pe = pa denotamos simplesmente por 


p. 
2.5.5 Exemplos 
Exemplo 1: 
| 1 0 0 3 
5 é E Pç=P,=3 


m=3,n=3ep=ã3. Então, a solução é única e xı = 3, X, = -2 e x; = 2 


Exemplo 2: 
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m=2,n=3e p= 2. Temos um grau de liberdade: x, = -10 - 7X3 € X2 = 
= -6 - 5x3. 


Exemplo 3: 


m = 3, n = 3, Pe = 2 e pa = 3. O sistema é impossível e, portanto, não existe 
solução. 


Exemplo 4: 
1 0 -10 -2 -l0 
0 1 7 1 4 Pe =Pa=?2 
oo o 0 0 


m=3,n=4ep=ã2. Temos dois graus de liberdade: x, = -10 + 10x3 + 2x4 
ex = 4 - 7x3 - X4. 


2.5.6 Agora, depois de termos mostrado como é possível resolver sistemas 
de equações lineares através de matrizes, podemos voltar ao problema que ha- 
víamos proposto no início do capítulo, relativo à quantidade de hidrogênio e 
oxigênio necessária para se formar a água. 

Sabemos que 

xH, + yO, — zH,0 
onde x, y, Z devem satisfazer 


2x - 2z 
2y- z 


Hs 
Do 


A matriz ampliada, associada ao sistema é 


2 0 -2 0 
0 2 10 


que, reduzida à forma escada, dá 
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ou seja, z é uma variável livre e, assim, se tornarmos Z = À, teremos 


x- A=0 
»-5A=0 
z2 
ou ” l 
AERE 
£ 1 


Note o significado de termos um grau de liberdade na solução deste 
sistema. Temos apenas estabelecida a proporção com que os elementos devem 
entrar na reação, e, para diferentes valores de A, teremos quantidades diferentes 
de reagentes produzindo quantidades diferentes de água. Por exemplo, 
se À = 2, teremos 2H} + O, > 2H,0 
se À = 4, teremos 4H, + 20, > 4H,0 


2.5.7 Exemplos 
Exemplo 1: Resolver o sistema 


x+2+tz+t t=0 
x+3y-z+2%=0 


A matriz associada ao sistema é 


que reduzida à forma escada fornece 
1 O 5 1/0 
O 1 -2 1 0 


Reinterpretando o sistema, vemos que z e t são variáveis livres (grau de liber- 
dade 2). Chamando z = À, e t = à obtemos: 


=SM +M 
= 2h -M 
= M 

2 


“m NYX 
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ou, na forma matricial 


x -5 1 
y | 2 -1 
z ad tA 0 
t 0 l 


Observe que [- 5 2 1 OF e [1 - 1 0 1]' são soluções do sistema ob- 
tidas da seguinte forma: a primeira, fazendo À, = 1 e A = 0, e a segunda, 
AM =0e à = 1. Elas são chamadas soluções básicas do sistema porque geram 
todas as outras. Todo sistema homogêneo tem solução que pode ser escrita 
desta forma. Basta reduzir o sistema, observar as variáveis livres e atribuir 
valores 1 para uma delas e zero para as outras, obtendo as soluções básicas 
(tantas quanto o grau de liberdade). A solução será uma soma destas soluções 
multiplicadas por constantes. 


Exemplo 2: Resolver o sistema 
l x+3y+ z=0 


2x + 6y +2z=0 
-x - 3y - z=0 


A matriz associada é 1 3 1 0 
6 2 0 
-1 -3 -1 0 
que reduzida torna-se |1 3 1 0 
o 0 00 
O 000 
Reinterpretando, vemos que y e z são variáveis livres. 
Fazendo y = A ez = As, temos 
x=-3M-dh 
y=M 
Z= A2 


As soluções básicas são então: x = -3, y =1,z=0ex=-l,y=0,z=1. 
Assim 


x -3 -1 
y ns, À 1 + ha 0 
Z (0 1 


Exemplo 3: Resolver o sistema 


x+2y+z+ t=1 
xt3y-z+2t=3 
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A matriz associada é 
1 2 1 1 1 duzida à fi da t 
13423 que reduzida à forma escada torna-se 


1 0 5 -1 3 A Es fia 
o; . Reinterpretando, vemos que z e £ são livres. 
Re -2 1 2 
Fazendo z = A e t = M, obtemos 
X = -54 E As +3 
y= 2 = A2 t2 


Z = Ai 

t = A2 

x -5 1 3 

2 -1 2 

ou $ = hi l + Àz + 0 
t 0 1 O 


Compare com o exemplo 1. O que você nota? 


2.6 EXERCICIOS 


1. Resolva o sistema de equações, escrevendo as matrizes ampliadas, associadas 
aos novos sistemas. 


2x- yt32=11 
4x - 3y +2z= 0 
x+ y+ z= 6 
3x+ y+ z= 4 


2. Descreva todas as possíveis matrizes 2 X 2, que estão na forma escada redu- 
zida por linhas. 


3. Reduza as matrizes à forma escada reduzida por linhas. 


Bj ul agi Bo 6d golo 2 2 
+ AR S wo RE 
gog de vê 3 -4 2 

2 -3 1 

blo 1 3 2 
2 1 -4 3 
E: nã e] 
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4. Calcule o posto e a nulidade das matrizes da questão 3. 


5. 


3x + 5y 1 
2x +Zz=3 
5Sx+ y-z=0 


Dado o sistema 


escreva a matriz ampliada, associada ao sistema e reduza-a à forma escada 
reduzida por linhas, para resolver o sistema original, 


. Determine k, para que o sistema admita solução. 


-4x +3y=2 
5x - 4y=0 
2X - y=k 


. Encontre todas as soluções do sistema 


14 
=2 
-1 


Xi + 3x, + 2X3 + 3x4 - Txs 
2x: T 6x: + X3- 2X4 + 5x5 
xi + 3x, - X3 + 2Xs 


il 


. Explique por que a nulidade de uma matriz nunca é negativa. 


, Foram estudados três tipos de alimentos. Fixada a mesma quantidade (1 g) 


determinou-se que: 

i) O alimento I tem 1 unidade de vitamina A, 3 unidades de vitamina B e 
4 unidades de vitamina C. 

ii) O alimento II tem 2, 3 e 5 unidades respectivamente, das vitaminas A, B 
ec. 

ii) O alimento MI tem 3 unidades de vitaminas A, 3 unidades de vitamina C 
e não contém vitamina B. 


Se são necessárias 11 unidades de vitamina A, 9 de vitamina B e 20 de vita- 
mina €, 


a) Encontre todas as possíveis quantidades dos alimentos I, II e IH, que for- 
necem a quantidade de vitaminas desejada, 


b) Se o alimento I custa 60 centavos por grama e os outros dois custam 10, 
existe uma solução custando exatamente Cr$ 1,00? 


Resolva os sistemas seguintes achando as matrizes ampliadas linha reduzidas 
à forma escada e dando também seus postos, os postos das matrizes dos 
coeficientes e, se o sistema for possível, o grau de liberdade. 


10 


11. 


12. 


13. 


14. 


15. 


16. 


17. 
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xy + 2x3 - X3 + 3x4 =1 


(E 
ts 
X x 
++ 
< Y 
+ + 
Se 
TRT 
So 


O método de Gauss para resolução de sistemas é um dos mais adotados 
quando se faz uso do computador, devido ao menor número de operações 
que envolve. Ele consiste em se reduzir a matriz ampliada do sistema por 
linha-equivalência a uma matriz que só é diferente da linha reduzida à forma 
escada na condição b) de 2.4.1, que passa a ser: b) Cada coluna que con- 
tém o primeiro elemento não nulo de alguma linha, tem todos os elementos 
abaixo desta linha iguais a zero. As outras condições a, c e d são idênticas. 
Uma vez reduzida a matriz ampliada a esta forma, a solução final do siste- 
ma é obtida por substituição. 


Exemplo: 


l 
Douw 


2x, + X% = 
Xi =- 3X, = 
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a última matriz corresponde ao sistema: 


l 5 
Xı + FA = 7 
X, = -1. 
Eos 1 5 ; 
Por substituição, xı - 355 ou seja, x, = 2. 


Resolva pelo método de Gauss os Exercícios 14, 15 e 16 e compare as res- 
postas. 


18. a) Mostre a proposição 2.4.3 para matrizes 2 X 2 quaisquer. | 
b) Sinta a dificuldade que você terá para formalizar o resultado para matri- 
zesn X m, mas convença-se de que é só uma questão de considerar to- 

dos os casos possíveis, e escreva a demonstração. Consulte 2.7. 


19. Chamamos de sistema homogêneo de n equações e m incógnitas aquele siste- 
ma cujos termos independentes, b;, são todos nulos. 


a) Um sistema homogêneo admite pelo menos uma solução. Qual é ela? 
b) Encontre os valores de k E R, tais que O sistema homogêneo 


2x - 5y t 22 =0 
Xe + y+ z=0 
2x +kz=0 


tenha uma solução distinta da solução trivial (x = y = Z = U). 


20. Considere o sistema 


x+ 6) -82=1 
2x + 6y -42=0 


Note que podemos escrevê-lo na forma matricial 
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1 
x 
a) Verifique que a matriz X, =f y |= + é uma solução para o sistema. 
Z 
0 


b) Resolva o sistema e verifique que toda “matriz-solução” é da forma 


x -4 -l 
X=|y|=A| 2|+ + 
z 1 0 
onde AE R. 
c) Verifique 

-4 -4A 

At 2l=| 2) 

1 A 


é a solução do sistema homogêneo, associado ao sistema (=), 


Rea E doa E 
Cem [! 6 HIGEN. 


d) Conclua, dos itens a}, b) e c), que o conjunto-solução do sistema * é o 
conjunto-solução do sistema *»*, somado a uma solução particular do sis- 
tema *. 


21. Dado o sistema 


1 2 0 -l x 2 
t o0 2 aļ|lyi_}2 
| 2 2 -l z| ł4 
3 4 4 -3 w 8 


a) Encontre uma solução dele sem resolvê-lo. (Atribua valores para x, y, z 
e w.) 

b) Agora, resolva efetivamente o sistema, isto é, encontre sua matriz-sciução. 

c) Resolva também o sistema homogêneo, associado, 

d) Verifique que toda matriz-solução obtida em 5) é a soma de uma matriz- 
-solução encontrada em c) com a solução particular que você encontrou 
em a). 


22. Altamente motivado pelos Exercícios 20 e 21, mostre que toda matriz-solu- 
ção de um sistema linear AX = B é a soma de uma solução do sistema ho- 
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23. 


25. 


mogêneo associado AX = O com uma solução particular de AX = B. Suges- 

tão: siga as etapas seguintes, usando somente propriedades de matrizes. 

i) Mostre que se X, é uma solução do sistema AX = 0 e X, é uma solução de 
AX = B, então X, + X, é solução de AX = B. 


ii) Se X, e X, são soluções de AX = B, então X, - X, é solução de 
AX = 0. 


üi) Use í) e ii) para chegar à conclusão desejada. 


Faça o balanceamento das reações: 

a) N.Os = NO, + 0: 

b) HF + SiO, > SiF, + H,O 

c) (NH), CO; > NH; + H,0 + Co, 


(decomposição térmica do N,0s) 
(dissolução do vidro em HF) 


. Dado o sistema linear 


3x + 5y + 12z -w = -3 
xt y+ &z-w=6 
2y + 22+w= 5 


a) Discuta a solução do sistema. 
b) Acrescente a equação 2z + kw = 9 a este sistema, encontre um valor de 
k que torne o sistema incompatível. 


Sabe-se que uma alimentação diária equilibrada em vitaminas deve constar 
de 170 unidades de vitamina A, 180 unidades de vitamina B, 140 unidades 
de vitamina C, 180 unidades de vitamina D e 350 unidades de vitamina E. 

Com o objetivo de descobrir como deverá ser uma refeição equilibrada, 
foram estudados cinco alimentos. Fixada a mesma quantidade (1g) de cada 
alimento, determinou-se que: 


i) O alimento I tem 1 unidade de vitamina A, 10 unidades de vitamina B, 
1 unidade de vitamina C, 2 unidades de vitamina D e 2 unidades de 
vitamina E. 

ii) O alimento II tem 9 unidades de vitamina A, 1 unidade de vitamina B, 
O unidades de vitamina C, 1 unidade de vitamina D e 1 unidade de 
vitamina E. 

iii) O alimento IN tem 2 unidades de A, 2 unidades de B, 5 unidades de 
C, 1 unidade de D e 2 unidades de E. 

iv) O alimento IV tem 1 unidade de A, 1 unidade de B, 1 unidade de C, 
2 unidades de D e 13 unidades de E. 

v) O alimento V tem 1 unidade de A, 1 unidade de B, 1 unidade de C, 

9 unidades de D e 2 unidades de E. 

Quantos gramas de cada um dos alimentos I, II, HI, IV e V devemos ingerir 

diariamente para que nossa alimentação seja equilibrada? 


Sistemas de Equações Lineares 55 


26. Necessita-se adubar um terreno acrescentando a cada 10m? 140 g de nitrato, 


190 g de fosfato e 205 g de potássio. 
Dispõe-se de quatro qualidades de adubo com as seguintes características: 
i) Cada quilograma do adubo I custa 5 u.c.p. e contém 10 g de nitrato, 
10 g de fosfato e 100 g de potássio. 
if) Cada quilograma do adubo II custa 6 u.c.p. e contém 10 g de nitrato, 
100 g de fosfato e 30 g de potássio. 
iï) Cada quilograma do adubo III custa 5 u.c.p. e contém 50 g de nitrato, 
20 g de fosfato e 20 g de potássio. 
à) Cada quilograma do adubo IV custa 15 u.c.p. e contém 20 g de nitra- 
to, 40 g de fosfato e 35 g de potássio, 
Quanto de cada adubo devemos misturar para conseguir o efeito desejado se 
estamos dispostos a gastar 54 u.c.p. a cada 10 m? com a adubação? 


27. Deseja-se construir um circuito como o mostrado na figura, 


onde V, = 280 V, Va = 100V, Va = 50V, R, = 2082, R, = 302, 
R3 = 500, R4 = 409, Rs = 1009. 


Dispõe-se de uma tabela de preços de vários tipos de resistências; assim 
como as correntes máximas que elas suportam sem queimar. 


resistências 


De que tipo devemos escolher cada resistência para que o circuito funcione 
com segurança e a sua fabricação seja a de menor custo possível? 


Biblioteca de 
Ciência & Tecno 
Ei l a P 


f 
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28. Uma placa quadrada de material homogêneo é mantida com os bordos AC 
e BD à temperatura de 20°C, o bordo AB a 40°C e CD a 10°C, com o 
uso de isolantes térmicos em 4, B, Ce D (vide figura). 


Após ser atingido o equilíbrio térmico, qual é a temperatura aproximada 
em cada ponto da placa? 


29. Consideremos uma unidade de produção (muito simplificada) de um proces- 


so de produção industrial de um determinado composto C C a partir de certos 
compostos 4 e B (segundo a reação química 4 + B = C): 


Ao, Bo, Co 


alimentação 
A+B TC 


resfriador 
A2 
B2 
C produto final 


reator 


reciciagem 


Ao = 100 kg/h, Bo = 100 kg/h, Co = 10 kg/h são os fluxos de alimentação, 
isto é, a quantidade de material jogada dentro da unidade de produção por 
hora, enquanto que 4;, B; e G são os fluxos em cada estágio da produção. 
Sabe-se, ainda que: 
i) No reator a reação processa-se em condições tais que a quantidade de 4 
após a reação é 0,487 da sua quantidade antes da reação, enquanto a de 
B é 0,266 e a de C é 4,675 de suas respectivas quantidades antes da reação. 
ii) Baseado no fato do ponto de ebulição de C ser inferior ao de A e B, 
o filtro constitui-se de um destilador. Dessa forma o vapor dentro do 
filtro tem maior concentração de C do que 4 e B, e é continuamente 
retirado do filtro, sendo levado para um resfriador do qual obtemos o 
produto final. Enquanto isso a parte não vaporizada no destilador é 
levada de volta ao reator para ser reciclada. Tem-se a informação de 


TREA g 


Sistemas de Equações Lineares 


que a quantidade de 4 em forma de vapor dentro do filtro é, em um 
determinado instante, 0,5854 da quantidade de A presente naquele 
instante na parte não vaporizada, enquanto que para B e C estas rela- 
ções são 1,50 e 1,07 respectivamente. 
Deseja-se saber qual é o grau de concentração de C no produto final se a 
unidade opera em condição estacionária (isto é, os fluxos de A, B e C não 
mudam com o tempo em cada estágio), sabendo que a concentração de 
C, na mistura que passa do reator para o filtro é de 68%. 
2.6.1 Respostas 
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l.x = ~l, y=2, Zza 
3.a) |1 0 0 -4 Ill 0 2 
0 1 0 -3 0 1 1 
o 0O 1 -1 0 0 0 
0 0 0 
b) 705 
É a T 
0 1 3 -2 
0 0 o 0 
7 1 17 
A go Ta Pa 
7.x = l- 3% - X5 
x3=2+ Xs 
Xa = 3 t 2x 
9. a) Sejam x, y e z as quantidades de alimentos 1, II e HI respectivamente. 
Então 
5 8 
x=-5+3z, y=8-3z onde yss 
b) Sim. x=1, y=2, 2=2 
17 7 5 4 
lL x= 5 55 pe qa 
a = 2 = Pes gl=1 
13. pa =2=pPe, gl =1,x =3z,y=0 
15. pa = 3 = Pos gl=0,x=y=z=0 
19.a) x; = 0 b)k=2 
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21l.0)x=0, y=z=1, w=0 


b) c) 


>» x» 
» 00» 
=-->» 
»00> 


23. a) 2 N20; — 4 NO, + 02 
b) 4 HF + SiO, —> SiF4 + 2H,0 
c) (NH), COs —| 2 NH, + H,O + Co, 


27. Sugestão: Calcule as várias correntes que circulam no circuito para depois 
fazer a escolha dos tipos de resistência. Para isto use as Leis de Kirchoff: 
i) A soma das correntes que entram em um nó de um circuito é igual à 
soma das correntes que saem deste nó. 
ii) A partir de um ponto qualquer de uma malha, se a percorrermos em 
um sentido qualquer, ao voltarmos ao mesmo ponto, a soma algébrica 
das quedas de potencial é nula. 


Leve em conta as observações: 


i) R 
—— ymm 
A H 8 


Neste caso, ao irmos do ponto A ao ponto B há uma queda de poten- 
cial dada por Ri. Se fôssemos do ponto B ao ponto A haveria uma 
queda de potencial de -Ri, ou seja, um aumento de potencial de Ri. 
ii) 
e 
———li k 


A V 8 


Neste caso, ao irmos do ponto A ao ponto B há um aumento de po- 
tencial de V, ou seja, uma queda de potencial de -V. Se fôssemos de 
B até A teríamos uma queda de potencial de V. 


Aplique, então, as leis de Kirchoff ao circuito, obtendo um sistema linear. 

Generalizações do problema podem ser obtidas nas situações: 

i) Circuitos de Corrente Alterada (obtemos sistemas com coeficientes 
complexos). 

ii) Projetos de Circuito (cálculo das características dos componentes para 
que o circuito tenha certas especificações). 
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28. Sugestão: Sabe-se que a equação que rege o fluxo de calor é dada por: 


or T , ËT 


= Cad tap) 


do dy 


onde T é a temperatura num ponto (x, y) e no instante de tempo 1 e 
c > O é uma constante característica do material de que é feita a placa, 


: ý or 
No equilíbrio térmico T não varia mais com o tempo e, portanto, ETAJ 0; 


a equação se torna 


e o problema se converte em achar T(x, y) satisfazendo (II) e tal que T 
tem um valor pré-fixado no bordo da placa. 

Modelo Aproximado: Substituímos a placa por uma “aproximação discreta” 
que consiste em uma malha (espera-se que quanto mais fina a malha melhor 


seja a aproximação — veja a figura abaixo) 


20°C 20°C 


nó (4, 3) 
nó (3, 2) 


e procuramos as temperaturas Ty nos (i, j) da malha que devem satisfazer 

a condição dada nos bordos e uma equação que é uma aproximação de (II). 
Para obter a aproximação de (II) temos, num ponto (i, J do interior da 
malha: 


PT)  _ Trapo 27 + Tr 
dx fan e 
T Ti j+1- 2Tġ + Tejo 
Pl a 
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substituindo em (II) e simplificando obtemos então: 


E a A 


(Observe que a temperatura num ponto do interior da malha deve ser a 
média aritmética das temperaturas dos seus vizinhos mais próximos.) 
Impondo a condição (III) nos pontos do interior da malha na figura acima, 
obtemos um sistema linear. Resolva-o! 

O que seria modificado se a “abertura” da malha na vertical fosse diferente 
da “abertura” na horizontal? Seriam necessárias mais informações sobre a 
placa? E se o formato da placa fosse diferente? 


Sugestão: O modelo teórico é construído baseado no seguinte fato: a massa 
que entra em um determinado estágio deve ser igual à massa que sai. 

Usando este fato em cada estágio, assim como as informações dadas no pro- 
blema, obtemos um sistema linear. Resolva-o e interprete os resultados. 
Você acredita neles? Os dados são reais? 


2.7 DEMONSTRAÇÕES 


Nesta seção, faremos com detalhes as provas dos teoremas 2.4.3 e 2.5.4, que 
omitimos anteriormente, para não prejudicar a sequência de exposição do assun- 
to. Estas demonstrações são apresentadas como matéria adicional, podendo ser 
estudadas ou não, dependendo de seu interesse. 


2.7.1 Demonstração do Teorema 2.4.3: Toda matriz é linha equivalente a 
uma única matriz-linha reduzida à forma escada. 


Demonstração 


12 Parte: Seja A uma matriz m X n qualquer. Se todo elemento da primeira 
linha de A é zero então a condição (a) está satisfeita, no que diz respeito a 
esta linha. Se a primeira linha tem algum elemento não nulo, seja k o menor 
inteiro j tal que aj; * O. Multiplicamos a primeira linha por 1/a;e a condição 
(a) ficará satisfeita. Agora, para cada i > 2 somemos (-a;k) vezes a primeira 
linha à i-ésima linha. Como resultado, teremos uma matriz cujo primeiro ele- 
mento da primeira linha é 1 e ocorre na coluna k. Além disto, todos os outros 
elementos da coluna k são nulos. 
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Consideremos agora a matriz B obtida acima. Se a segunda linha desta 
matriz for nula nada fazemos. Se houver elementos não nulos nesta linha, seja 
a coluna k' a primeira a conter um destes, Multiplicamos a segunda linha por 
l/b e a seguir, somando múltiplos adequados desta nova segunda linha às de- 
mais linhas, obtemos uma matriz cujo primeiro elemento não nulo da segunda 
linha é 1 e todos os outros elementos da coluna em que este elemento (1) se 
encontra são nulos. O importante é que neste processo não foram alterados os 
elementos b;,, bi, € nem a k-ésima coluna da matriz B. (Por quê). 

Repetindo o procedimento acima em relação às demais linhas (32, 42, ..., 
m-ésima) obteremos no final uma matriz M que é linha equivalente à inicial A, 
e que satisfaz as condições (a) e (b) da definição 2.4.1. 

As condições (c) e (d) serão satisfeitas através de um número finito de 
permutações de linhas da matriz M. 


24 Parte: Assim, mostramos nesta primeira parte que toda matriz A é linha 
equivalente a uma matriz-linha reduzida à forma escada. Para mostrarmos que 
só existe uma única matriz-linha reduzida à forma escada linha equivalente a A, 
observamos primeiramente que duas matrizes-linha reduzidas à forma escada 
que são linhas equivalentes só podem ser iguais. 

De fato, você pode observar que nenhuma das três operações com linhas 
(exceto a multiplicação de uma linha pela constante 1) pode ser efetuada numa 
matriz-linha reduzida à forma escada, sem que ela perca esta condição. (Pense 
nisto!) 

Agora, suponhamos que por operações com linhas, partimos de uma ma- 
triz M e podemos chegar a duas matrizes-linha reduzidas à forma escada, N e P. 
Teremos então M — N e M — P. Como as operações com linhas são reversíveis, 
isto significará que N será linha-equivalente a P, e, portanto, da afirmação desta- 
cada acima, N = P. 


2.7.2 Demonstração do Teorema 2.5.4 


12 Parte: Se o posto da matriz ampliada for maior que o da matriz dos coefi- 
cientes (menor não pode ser), então esta matriz reduzida à forma escada deve- 
ter pelo menos uma linha do tipo (00 ... Ocg}, com cy * O. Isto significa que 
o sistema associado a esta matriz (que é equivalente ao inicial) tem uma equa- 
ção do tipo: 

Ox, +... + 0x, = ck FO 


e portanto não admite solução. 


28 Parte: Por outro lado, se o posto da matriz ampliada, P, for igual ao da ma- 
triz dos coeficientes, temos dois casos a considerar: 
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a) se p = n, teremos a matriz-linha reduzida à forma escada: 


l 
A 0 O | Cı 
oo q olc 
ha | 
rag, | 
DO a O DL cn 
o 00 
0 Oo 0 0 
A solução do sistema será Xj = C1, oe Xn = Cn, portanto o sistema admi- 


te uma única solução, 


b) se p &n então p < n (pois p não pode ser maior que n, veja o Exer- 
cício 8 de 2.6) 
Neste caso, devemos considerar as yárias possibilidades para a matriz-linha 
reduzida à forma escada. Podemos analisar inicialmente quando esta matriz de 
posto p < n tem a forma: 


f; 
| 
A 0 as 0 | Z1p+1 din ĉi 
O œ 0 0 | 
SR | 
O 0 O .. DJ appe pn €p 
0 0 0 0 0 
o 0 0 0 (0) 0 
Teremos, neste caso: | X} = C1 -Gp+iXp+ -= —Sinkn 
Xp = Cp - üpp»ı¥p+ı = —pnXn 
e o sistema terá portanto infinitas soluções, sendo Xp+1, ..., Xn Variáveis li- 


vres, 
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Uma segunda forma a ser considerada para a matriz reduzida é 


t 
2. 0 O o. 0 | lips am Ci 
O O KR 01 
Sa | 
N | 
as | 
PAR, O Dt] apra apn “p 
o o 0 o 0 0 0 
0 9 0 o o 0 0 
então X2 =€C-Gp+.2Xp+2 +... +-dynXn 
X3 = C2 ~ Gype2Xp+a +... +-donXn 


Xp+ 1 = cp m äp Xp + 2 +... +- Gp nXn 
sendo X1, Xp+2» ---» Xn Variáveis livres. 


E assim podemos prosseguir de uma maneira sistemática e ver que em to- 
das as possibilidades para a matriz-linha reduzida à fornia escada de posto 
p < n, teremos um sistema com infinitas soluções e n - p variáveis livres. 

Observe que na 12 parte mostramos, usando contra-recíproca, que a 
igualdade de postos entre as matrizes ampliada e dos coeficientes é uma con- 
dição necessária para a existência de solução do sistema. Na 2? parte mostra- 
mos que esta condição também é suficiente, considerando as possibilidades a) e 
b). Ficou assim demonstrada a afirmação (i) de 2.5.4. Note ainda que também 
as condições (ii) e (iii) foram demonstradas em a) e b) respectivamente. 
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DETERMINANTE E MATRIZ 
INVERSA 


3.1 INTRODUÇÃO 


Já em 250 AC. havia exemplos da resolução de sistemas de equações através de 


matrizes, no livro chinês Nove Capítulos sobre a Arte Matemática, cujo autor é 
desconhecido. Também algumas noções ligadas a determinantes, o assunto que 
será objeto de estudo neste Capítulo, já eram conhecidas na China antiga. 

Mas, se por um lado já se utilizava a noção de determinantes no mundo 
Oriental há tanto tempo, no Ocidente este assunto começou a ser tratado espo- 
radicamente a partir do século XVII. Nesta época surgem trabalhos de G. W. 
Leibniz (1646-1716), de G. Cramer (1704-1752) que desenvolveu um método 
de resolução de sistemas através de determinantes, conhecido por “Regra de 
Cramer” e foi publicado em 1750 (provavelmente já conhecido por C. Maclaurin 
no em 1729, e alguns resultados simétricos de J. L. Lagrange (1736- 
-1813). 

Só no século XIX é que os determinantes passaram a ser estudados mais 
sistematicamente, a começar pelo longo tratado de A. L. Cauchy (1789-1857) 
EE a 2, tendo sido realizados, em seguida, trabalhos de C, G. Jacobi (1804- 
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A partir de então, o uso de determinantes difundiu-se muito e este con- 
ceito de um número associado a uma matriz quadrada mostrou-se extremamen- 
te útil para caracterizar muitas situações, como a de saber se uma matriz é 
inversível, se um sistema admite ou não solução, o que veremos nas próximas 


secções. 


3.2 CONCEITOS PRELIMINARES 


E = i 4 b 
Consideremos o sistema ax = b com a É O. A solução deste sistema é x = —. 


Observe que o denominador está associado à matriz dos coeficientes do sistema, 


ou seja, la). 
Num sistema 2 X 2 


b, 
b, 


KH 


a X1 + anx? 
aX, t ak 


resolvendo (desde que sejam possíveis as operações), encontramos 


bä - bad E ba, - dida: 
xy = E e Xs Dara 
Udo 7 lizia Gl — 412821 


Observe que os denominadores são iguais e estão associados à matriz dos coe- 
ficientes do sistema 

dm du 

da dar 


Num sistema 3 X 3 


anX tank, t ax = Dr 
duX, t anX3 * d33X3 = Do 
aX, t daX, t 33X3 = b3 


(desde que sejam possíveis as operações), ao procurarmos os valores de X,, X2 
e x3, vemos que eles têm o mesmo denominador 4,1422433 ~ 411423432 — 

- 042021033 t drgla3da +t 43342143 ~ 013022031, QUE também está associado à 
matriz dos coeficientes do sistema 


an n ag 
da än i23 
áy an “33 


Vamos rever estes números que aparecem nos denominadores associados às 


matrizes (quadradas). Estes números são casos particulares do que é chamado 
i i Bibiioteça de Í 
determinante de uma matriz quadrada. cE 
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3.3 DETERMINANTE 


Quando nos referirmos ao determinante, isto é, ao número associado a uma 
matriz quadrada A = [2;;] como na secção anterior, escreveremos: 


detA ou lAl ou detla;;] 


Então 
det [a] = a 
un dn ln äi 
det = = Und ~ Gula 
da d22 a21 4 
dn an 3 än än ag 
det| 2&2 am daj = |đ2 än daj = ananz -4u423432 -412421833 t 
a3 än das da än dz + 4i2823831 t Gialla 7 013023031 


Talvez seja conveniente avisá-lo de que o conceito de determinante no caso geral 
envolve muitos símbolos, o que dificulta a leitura. Para tornar a discussão mais sim- 
ples e organizada, vamos introduzir algumas definições necessárias. Comecemos 
lembrando o que significa uma permutação. Dados n objetos distintos 44, ..., än, 
uma permutação destes objetos consiste em dispô-los em uma determinada 
ordem. Por exemplo, (1 2 3) é uma permutação dos números 1, 2 e 3, 

(2 1 3) é outra permutação etc. A quantidade de permutações de n objetos é 
dada por n!, que é lido n fatorial e n! =n(n-1(n-2)+...2-1 (se 

n > 0). Por exemplo 3! = 3.2.1 =6. Define-se ainda O! = 1. 


3.3.1 Definição: Dada uma permutação dos inteiros 1, 2, ..., n, existe 
uma inversão quando um inteiro precede outro menor que ele. 


Consideremos as permutações de 1, 2, 3 e vejamos em cada permutação 
o número de inversões. 


Número de inversões 


Permutação 


(123) 
a 
(2 
(2 
(3 
(3 


PP GDS PDS nem E 


3 
$ 
R 
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Como um outro exemplo, podemos tomar duas das 4! = 24 permutações de 1, 
2, 3, 4. Assim, (3 2 1 4) tem 3 inversões e (4 3 2 1) possui 6 inversões. 
Voltemos ao determinante: 


ai än f3 


= G11422433 - 411423432 - 412421833 t 412423431 t 413421832 — G13022031 


Observe que aparecem todos os produtos 41;,02/,43j3» onde (fı j2 73) são as per- 
mutações de 1, 2 e 3. Além disso, vemos que O sinal do termo é negativo, se a 
permutação tiver um número ímpar de inversões. (Veja a tabela acima para verificar 
os sinais.) , 

Como generalização, o determinante de uma matriz quadrada [a;l xn é 
dado pela definição a seguir. 


3.3.2 Definição: det [a;;] = y (-1¥aij tj -anjn onde J = J(ji -~ jn) 


p 


é o número de inversões da permutação (jıjz ... jn) € P indica que a soma é 
estendida a todas as n! permutações de (1 2... n). 


Em relação a esta definição podemos fazer três observações: 


i) Se a permutação (jı j2 = jn) tem um número par de inversões, o coe- 
ficiente (-1y do termo correspondente na somatória terá sinal positivo; 
caso contrário, terá sinal negativo. 

ii) Em cada termo da somatória, existe um e apenas um elemento de cada 
linha, e um e apenas um elemento de cada coluna da matriz. 

iii) Através de uma reordenação conveniente dos termos, mostra-se que tam- 
bém é possível definir um determinante por 


det [ay] = J, (tja ap? ~ Sign 
p 


variando os primeiros e deixando fixos os segundos índices. Verifique isto 
no caso 3 X 3. 
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Propriedades 


i) Se todos os elementos de uma linha (coluna) de uma matriz A são nulos, 
det A = 0. 


A razão disto é que, pela observação (it), em cada termo que aparece no cálcu- 
lo do determinante há um dos elementos da linha (coluna) nula e, portanto, 
todos os termos se anulam, e o determinante é zero. 

ii) detA = det A' 
Daí inferimos que as propriedades que são válidas para linhas também o são 
para colunas. 
A prova desta propriedade é a seguinte: se A = [a;;], sabemos que A" = [by], 
onde bj; = aji. Então, pela definição de determinante, temos 


y, (-1V bij baj a bajy 
p 


X (1a; Ga + Gn 
p 


det [a;;] pela observação (iii). 


det [bz] 


11 


iii) Se multiplicarmos uma linha da matriz por uma constante, O determinan- 
te fica multiplicado por esta constante. 


Para verificarmos isto, chamemos de A a matriz original e B a matriz obti- 
da de A, multiplicando uma linha de A por uma constante k. Então, ao calcular- 
mos o determinante de B, pela observação (ii), em cada termo aparece um ele- 
mento daquela linha que foi multiplicada por k. Podemos colocar k em evidên- 
cia, e o que permanece é exatamente o cálculo do determinante de A. Portanto, 
det B = k det A. 


iv) Uma vez trocada a posição de duas linhas, o determinante troca de sinal. 


A razão disto é imediata se observarmos que ao trocar duas linhas de uma 
matriz, alteramos a paridade do número de inversões dos índices e, portanto 
trocamos o sinal dos termos. 


v) O determinante de uma matriz que tem duas linhas (colunas) iguais é zero. 


Isto é verdade porque se trocarmos as posições das linhas que são iguais, a 
matriz e, portanto, O determinante permanecerão os mesmos. Por outro lado, 
pela propriedade anterior, o determinante deve trocar de sinal e, portanto, a 
única possibilidade é que o determinante seja nulo. 
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vi) dii .. Ein do Um dy Um 
ba + Ch bn t Cn |= | ba bin | + | cùn Cin 
än e ünn Uni lnn äni Inn 


Para mostrar esta propriedade, usamos a definição de determinante c a 
distributividade. Mas cuidado! Observe que aqui temos a soma numa linha, e 
não uma soma de matrizes. De um modo geral, o determinante de uma soma 
de duas matrizes não é igual à soma dos determinantes das matrizes. Ou seja, 
det(A + B) £ det A + det B. Veja o Exercício 4 da secção 3.10. 

vii) O determinante não se altera se somarmos a uma linha outra linha mul- 
tiplicada por uma constante. 


Exemplo: 3 -2 |l 3 -2 1 
2 5 0|=|2 5 0 
2 4 -2 8 0 0 


Aqui, à terceira linha, somamos a primeira linha multiplicada por 2. Para pro- 
var esta propriedade usamos as propriedades (vi), (iii) e (7). 


viii) det(A - B) = det A - det B 


Mostre, inicialmente, esta propriedade para matrizes 2 X 2. Sinta a difi- 
culdade que se teria para demonstrá-la já em matrizes 3 X 3. A demonstração 
deste resultado para matrizes n X n é bem mais elaborada, mas -você terá con- 
dições de fazê-la usando matrizes elementares (veja a seção 3.8). 

A próxima propriedade é tão importante e útil no cálculo de um deter- 
minante que destacamos sua importância apresentando-a numa seção separada. 


3.4 DESENVOLVIMENTO DE LAPLACE 
Na seção 3.2 vimos que: 


Gn an 13 
lA] = 421 do2 a23 = 
üz da 33 


= d;1ä22đ33 - 411423432 — 412421433 + 412823431 t G13421432 ~ 813422631 
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Mas, podemos escrever esta soma como: 
Gu (8224833 — 43303) - a y2(421433 - 423031) + Ais(ânda, - ala) 


Ou ainda: 
da un 
üz dy 


än 423 
d3 33 


d 23 
an a33 


a - 4 + 43 


Observe que o determinante da matriz inicial 3 X 3 pode ser expresso em fun- 
ção dos determinantes de submatrizes 2 X 2, isto é, 


det A = a))An| - 8i2lAnl + aral Asa] 


onde A; é a submatriz da inicial, de onde a i-ésima linha e a j-ésima coluna 
foram retiradas. Além disso, se chamarmos 


Aj = (DIA; 
obtemos a expressão 


det A = aÃ, t GÃoo + dâ 


Esta propriedade continua sendo válida para matrizes de ordem n!, e assim po- 
demos expressar: 
det Anxa = nå +... t AnDp 


n +. $ 
= X aj(-1}* det Aj 
j=t 


Ao número A; (que é o determinante afetado pelo sinal (-1)*/ da submatriz 
Ajj, obtida de A retirando-se a i-ésima linha e a /-ésima coluna), chamamos 
cofator ou complemento algébrico do elemento ajj. Observe que na fórmula da- 
da, o determinante foi “desenvolvido” pela i-ésima linha. Uma forma análoga é 
válida para as colunas. 


3.4.1 Exemplos 


Exemplo 1: 
IA) =| 2 


1 1-2) 3 
! Li -1 | = -JAn + 144 + (Ds 
ti o 
( ] 


!Para uma demonstração, veja por exemplo Lipschutz, S.; Álgebra Linear, McGraw-Hill do 
Brasil Ltda., Rio de Janeiro, 1971. 
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onde 
ân = (-1)'*? f E é 5 =-2 
dns tai) les 
âa (Dj) dl=7 

Portanto 


IA] = (-2)(-2) + 1-8 + (-1)7=5 


O desenvolvimento de Laplace é uma fórmula de recorrência que permite 
calcular o determinante de uma matriz de ordem n, a partir dos determinantes 
das submatrizes quadradas de ordem n - 1. Em grande parte dos casos ele sim- 
plifica muito o cálculo de determinantes, principalmente se for utilizado um 
conjunto com outras propriedades dos determinantes. 


Exemplo 2: 
1 -2 3 {l -2 3 
Z yo a Sa i aa 
2-1 2 O 01 
=1. (Pell Ligo F 
CDC ql=1-O+4=s5 


O índice acima da igualdade indica o número da propriedade usada. Neste caso 
somamos a segunda linha à terceira. 


Exemplo 3: 
-1 2 3 -4 5 2 3 4 
4 2 0 O | (ui) 0 2 0 0 
-1 2 -3 0 -5 2 -3 01 
2 5 3 ] -8 5 3 ] 
O rE 5 -3 . Mo 0 4 
=u-npr]s 3 oO os 3 o|W E e 3 oọol= 
nes 3i al 8&8 -3 =] 13 0 -i 
: 4 
= (-2)(3X(-1) +? | e „į | = 6(-10 - 52) = 372 
Bibiioteça de 
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Note que na primeira passagem usamos a sétima propriedade ao somarmos à se- 


gunda coluna multiplicada por 2 à primeira coluna. Nosso intuito foi o de 
obter uma segunda linha com apenas um elemento não nulo, e então abaixar a 
ordem do determinante, usando menos cálculos. Seguindo este raciocínio, você 
pode também obter o determinante inicial, por exemplo, igualando o último 
elemento da primeira linha a zero. 


3.5 MATRIZ ADJUNTA — MATRIZ INVERSA 


Dada uma matriz A, lembramos que o cofator Aj do elemento a; da matriz é 
(-1)'H det Ajj, onde A;; é a submatriz de A, obtida extraindo-se a iésima linha 
e j-ésima coluna. Com estes cofatores podemos formar uma nova matriz A, de- 
nominada matriz dos cofatores de A. 


A = [4;] 
E. lo: 
ASUR 210 
A=|-3 1 4 
| 6 5 
all 4 
âi = (-1)' i 6 5 = -19 
An = (1)! *? a É =19,.. etc 
-19 19 -19 
Então, Ā= | -5 10 -ll 
4 -8 5 


3.5.1 Dada uma matriz quadrada A, chamaremos de matriz adjunta de A 
à transposta da matriz dos cofatores de A. 
adj A = A' 
No exemplo anterior 
19 -5 4 


adjA=| 19 10 -8 
-19 -11 5 
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Vamos efetuar, neste exemplo, A » À”. 


-19 0 0 1 0 0 
0o -19 o|=-19 |0 1 0 | =-191, 
o 0 -19 0o 01 


Além disto, podemos verificar que det A = - 19. Então A * A' = (det A)I;. Este 
resultado não foi obtido por acaso, mas é válido para toda matriz quadrada A 
de ordem n. 


3.5.2 Teorema: A : A’ = A - (adj A) = (det A)1, 


Para demonstrarmos esta proposição, usamos a propriedade (v), segundo a 
qual o determinante de uma matriz que tem duas linhas (colunas) iguais é zero. 
e o desenvolvimento de Laplace. Vamos fazê-la esquematicamente, para matrizes 
3 X 3. A demonstração é a mesma para matrizes n X n. 


Prova: (n = 3) 
äi) Go i3 An Ân Âz 
A - (adj A) =] ana am danj’ |ân ân Anz ]|= ley] 
a3 dz 433 âi Ân âz 


Calculando os elementos ci;, achamos que 
cu = lÂ tando t 4&iâ = det A. 
C12 = Do, t dÂ t dysÃos, 


Usando o desenvolvimento de Laplace em relação à segunda linha, temos: 


& än i3 
cn det| any du qQ3|=0 
an az 433 
pois duas linhas são iguais. Analogamente, 


cr=detA e cy=0 se i#j 


Então: 
det A 0 0 
A - (adj A) = 0 det A 0 = (det A) l, 
0 0 det A 


3.5.3 Definição: Dada uma matriz quadrada A de ordem n, chamamos de 
inversa de A a uma matriz B tal que A - B =B - A = I,, onde I, é a matriz 
identidade de ordem n. Escrevemos A”! para a inversa de A. 
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3.5.4 Exemplos 


Exemplo 1: 4 3 
5.5 
2 3 E R E 
Seja A = E | Então A” = elo, E 
5 5 


à o Fiane! 
pois A-A!=L e A! + A = (Verifique!) 


lo 2: 
Exemplo | Re 
Seja À = il 4 


Procuremos sua inversa, isto é, 


-|i A tl que A-B=L e B-A=L 
c d 


Impondo a primeira condição, 


6 2 a b | q 
11 4][jc d 01 
A B L 
ta +2 G+2d - P 
lla +4c llb +4d 0 1l 


Portanto, 
= 6b+2d=0 
6a +2c=1 e ta 
lla+4c=0 ilb + 
Resolvendo os sistemas, temos 
d = 2 b = -1 
C=- 1 d = 3 
Teremos então, 
6 2 2 dd. f o] 
u 4||- L 3 01 
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ou seja, A - B = i. Também 


ou seja, B. A = 


= 
LM 
Es 
E 
E mad 
o 
3 
eum 
8 


é a inversa da matriz A. (B = A!) 


Observações: 
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i) Se A e B são matrizes quadradas de mesma ordem, ambas inversíveis (isto 


é, existem A? e B'!), então A » B é inversível e (AB)! = Bl. Ai, 


De fato, basta observar que (AB)(B-!A-!) = A(BB-I)AT = AIA”! = 


= AA! = | e que, analogamente (B~! A!) (AB) = I. 


ii) Se A é uma matriz quadrada e existe uma matriz B tal que BA = I, 
então A é inversível, ou seja A”! existe e, além disso, B = AT! 


Em outras palavras, basta verificar uma das condições para a inversa de 


uma matriz, e esta será única. 


A prova da primeira parte, ou seja, de que A”! existe, será feita em 


3.8.6. Por ora, mostraremos apenas que B = A. De fato, se A`! existe, temos 


a seguinte sequência: B = BI = B(AA!) = (BAJA! = IA! = AT, 


iii) Nem toda matriz tem inversa, 


2 x : : Jis 
Por exemplo, para mostrar que f r] não tem inversa, é suficiente 


> si 0 2 a bi I1 0 N = 
mostrar que a equação matricial k Ji A = Ê q não tem solução. 


Isto é verdade, pois 


Ee 6d 


implica que 2c = 1 e ¢ = 0, e não podemos ter estas igualdades simultanea- 


mente, 


76 ÁLGEBRA LINEAR 


Suponhamos agora que Anxn tenha inversa, isto é, existe A”! tal que 
A. A! = 1, Usando o determinante temos 


det(A - A7!) = det A - det A? e deti, = 


Então: 
det A © det A7! =| 
Desse produto concluímos que se A tem inversa, 
ijdetA # 0 
l 
.= -1 e 
e i)detA” = Jea A 


Ou seja, det A # 0 é uma condição necessária para que A tenha uma inversa, 
Vamos ver que esta condição também é suficiente. Já vimos em 3.5.2 que 


A. À'- (det A)L Se detA £ 0, A «— 


SEER A' = I e como a inversa é úni- 


ca, então A! = . 
det A 


Em resumo: 


3.5.5 Teorema: Uma matriz quadrada A admite uma inversa se, € somente se 
det A +0. 

Neste caso: 
l 


OD 
ii det A 


(adj A) 


Este resultado nos fornece um novo método de calcular a inversa de uma 
matriz. Consideremos a matriz do Exemplo 2 anterior: 


6 2 
a-ha 


det A = 24 - 22 = 2 Æ+ 0 e, portanto, existe a inversa de A. Calculemos sua 


inversa pela relação A! = 1 (adj A). 


E 4 -ll dio 4 -2 
À = È j e TER 


Então 
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3.6 REGRA DE CRAMER 


O cálculo da inversa de uma matriz fornece um outro método de resolução de 
sistemas lineares de equações. Este só se aplica a sistemas lineares em que o nú- 


mero de equações é igual ao número de incógnitas. Suponhamos que desejásse- 
mos resolver o sistema linear de »-equações e n-incógnitas. 


dX Fo... tank = bi 


üni Xı Feras n nnn = bn 


Podemos escrever este sistema na forma matricial 


di. Gm Xi bi 
Uni. äm Xn Dn 
ou 
A-X=B 
onde 
Zn Gin 
A = : é a matriz dos coeficientes e 
ânı ann 
bi X1 
B=|: | éa matriz dos termos independentes, e X = 
4 Xn 


a matriz das incógnitas. Para esta equação suponhamos que det A £ O e por- 
tanto, que A tenha a inversa A™!. Então 


A`! (AX) = A`! B 
(A7 A)X = A'B 
LX = A'B 
X= AB 
Na forma matricial 
X1 411 Gin Ge b; 
Xn Em nn bn 
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Usando a relação para matriz inversa dada em 3.5.4, temos 


X1 An e. Am bi 


Então 
“dbiAn to. + badm 


A= det A 


Mas note que o numerador desta fração é igual ao determinante da matriz que 
obtemos de A, substituindo a primeira coluna pela matriz dos termos indepen- 
dentes. De fato, usando o desenvolvimento de Laplace, obtemos: 


bi do « Am 
E = bi; +. + bnôôn 
bn am ann 
Ou seja 
bı da din 
bn n2 mn 
X1 >[—————————— >> 
dn Go Gmn 
än) Im ünn 


au =~ by o « Gm 


an -~ bn Im 


Au Qin 


&m au. änn 


para i = Luc2s Ml: 


mos o determinante da matriz dos coeficientes 


Observe que no denominador te 
z obtida de A, 


(det A + 0), e no numerador aparece o determinante da matri 


Determinante e Matriz Inversa 79 


PAA a Gia coluna pela coluna dos termos independentes. Este méto- 
ção de um sistema linear de n e õ incógnitas, 

quações e n incógnitas, que só po- 
de ser aplicado quando o determinante da matriz dos coeficientes for não ul 
é chamado Regra de Cramer. Ee 


3.6.1 Exemplo 


Dado o sistema de 3 equações e 3 incógnitas: 


2x - 3y +72 =1 
x + 32=5 
2y- z=0 
temos 
2 3 7 
det|1 (6 3ļ|=-1 #0 
0 2 -~l 
Portanto, podemos usar a Regra de Cramer. 
Então: 
1 -3 7 
5 o 3 
E 0 2 -= 
= =-4 
-1 E 
2 1 7 
1 5 3 
0 0 ~} 
y = = 9 
=] 
2 -3 1 
1 0 5 
0 2 0 
z =—— 18 
-1 


= Cabe aqui um comentário sobre a Regra de Cramer. Embora seja muito 

útil, pois dá uma forma explícita das soluções de um sistema, ela não é muito 

usada para cálculos numéricos. Isto porque o número de operações que ela 

envolve é muito grande, quando trabalhamos com muitas equações. No cálculo 

E determinante de uma matriz de ordem n, temos que calcular n! produtos 

: a GE K depois somá-los. (Veja a definição.) Efetuamos então n!(n - 1) + 
n! = n!n ~ 1 operações. Como para resolver um sistema n X n pela 
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Regra de Cramer precisamos calcular n + 7 determinantes de ordem n, o núme- 
ro de operações se elevaria a (n + 1)(n!n - 1), que é maior que n?n!. 

Como um exemplo, para resolvermos um sistema de 10 equações e 10 
incógnitas, pela Regra de Cramer teríamos um número de operações superior a 
10710! = 362.880.000 operações, enquanto que pelo método de redução de li- 
nhas não chegaríamos a 14.000. 

Muitos dos problemas que aparecem em Engenharia, Economia, Biologia 
etc., costumam envolver um grande número de incógnitas, de ordem 100 ou 
1.000, por exemplo. Nestes casos, mesmo os métodos de eliminação e redução 
por linhas podem não ser adequados. Então nos meios computacionais prefere- 
-se usar métodos numéricos iterativos (como, por exemplo, o de Gauss-Seidel). 
Estes processos iterativos serão nosso objeto de estudo no capítulo 13. 


3.7 CÁLCULO DO POSTO DE UMA MATRIZ 
ATRAVÉS DE DETERMINANTES 


Muitas vezes, é suficiente saber apenas se um sistema de equações lineares tem 
solução sem precisar resolvé-lo, isto é, sem explicitar as soluções. Por exemplo, 
ao estudar a posição relativa de duas retas no plano, dadas pelas equações 
y-2x=3ey- 3x =2, podemos estar interessados em saber apenas se elas 
se interceptam ou não, sem determinar seu ponto de intersecção. Ou seja, que- 
remos saber se o sistema 
Jos 2% = 
o - 3x = 
admite ou não solução. 
Como já vimos em 2.5, a existência e o número de soluções estão relacio- 
nados com o posto da matriz dos coeficientes e o posto da matriz ampliada. 


Vamos ver agora uma maneira de obter o posto de uma matriz usando deter- 
minantes. 


} | 
N w 


3.7.1 Teorema: O posto (caracterrstica) de uma matriz A (quadrada ou 
não) é dado pela maior ordem possível das submatrizes quadradas de A, com 
determinantes diferentes de zero. 


(Para uma demonstração, deste teorema veja os exercícios 18, 19 e 20 
da seção 3.10.) 
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3.7.2 Exemplos 


Exemplo 1: Dada a matriz 4 X 5 
l 3 -2 5 3 
l 11 -15 19 14 
3 1 7 1 -2 
7 -3 235 -7 0 


podemos verificar que cada submatriz de ordem 4 (há 5) tem determinante 0. 
Também o determinante de cada submatriz de ordem 3 (há 40) é zero. Mas 


1 3 
de: fi n|-5+0 


Exemplo 2. Dado o sistema linear 


Então, o posto é 2. 


x+2y+37=1 
-2x+ y+ z= 0 
6x - 3y - 3z = -1 


vamos dizer se ele é possível ou não, sem resolvê-lo. 
A matriz dos coeficientes 


1 2 3 
À = | -2 l l 
6 -3 -3 


tem determinante O, pois a terceira linha é igual à segunda multiplicada por -3. 
Portanto, o posto de A é menor que 3. (Se det A + 0, o posto seria 3, pois A 


é submatriz dela mesma.) Como Ê E 


de ordem 2, com determinante diferente de zero; portanto, seu posto é 2. 


| = 5, À tem uma submatriz quadrada 


Tomemos agora a matriz ampliada do sistema 


1 2 3 1 
B=|-2 | 1 
6 -3 3 -1 
2 3 1 
Como | ı ı of =1,0 posto de B é 3. Concluímos assim, que o sistema 
33 | 


Biblioteca de 
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não admite solução, pois o posto da matriz dos coeficientes é diferente do pos- 
to da matriz ampliada. 

Observação: 

Num sistema de n equações e n incógnitas, onde o determinante da matriz dos 
coeficientes é diferente de O, existe uma única solução. 


* 3.8 MATRIZES ELEMENTARES 
Um processo de inversão de matrizes 


O cálculo da inversa de uma matriz usando determinante, envolve um núme- 
ro muito grande de operações. O processo prático de inversão que vamos 
apresentar nesta seção é baseado nas operações com as linhas de uma matriz 
e, em termos de cálculos, é muito vantajoso. O conceito de matrizes elemen- 
tares que introduziremos aqui será utilizado para mostrar a validade deste pro- 
cesso e ainda para demonstrar vários resultados já enunciados em seções ante- 
riores. 

Observemos, inicialmente, que cada operação com as linhas de uma ma- 
triz corresponde a uma multiplicação dessa matriz por uma matriz especial. 


3.8.1 Exemplos 


Exemplo 1: Ao multiplicarmos a primeira linha da matriz 


1 2 4 
A=|]0 1 3 
2 1 -4 
por 2, obtemos a matriz 
2 4 8 
01 3 
2 1 -4 
que é exatamente o produto 
2 0 Ojj] 2 4 
Oo 1 0/10 1 3 
0 01 2 1 -4 
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Exemplo 2: Ao trocarmos a primeira e a segunda linha da matriz A acima 
obtemos i 


0O 1 3 
l 4 
2 1 -4 


Este resultado é o mesmo que o produto 


O 1 0 1 2 4 
1 0 0j-JjO 1 3 
o 01 2 i -4 


Exemplo 3: Ao somarmos à primeira linha da matriz A a segunda linha 
multiplicada por 2, obtemos 


1 4 10 
0 1 3 
2 1 -4 
que é o mesmo que o produto 
1 2 Ofjf1l 4 
O 1 0/0 3 
0 o1/|2 -4 


Observando mais cuidadosamente estes exemplos, vemos que aplicar uma 
Operação elementar nas linhas da matriz A é o mesmo que aplicar esta opera- 
ção elementar na matriz identidade e, em seguida, multiplicar esta nova matriz 
por A. Vejamos isto em outros exemplos. 

Exemplo 4: Se tomarmos a matriz identidade I} e trocarmos a primeira e 
a terceira linha, obteremos a matriz 


0 01 
0 1 0 
1 0 0 


Se multiplicarmos esta matriz pela matriz A do exemplo 1, teremos 


0 01 1 2 4 2 l -4 
O 1 0||0 1 3)=10 1 3 
1 0 0/12 -4 i 2 4 


Sujo resultado é exatamente a troca da primeira e terceira linha da matriz A. 
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Exemplo 5: Se tomarmos I, e somarmos à terceira linha a segunda multi- 
plicada por -3, obteremos 
0 0 
1 0 
-3 1 


Se multiplicarmos esta matriz pela matriz À do Exemplo 1, teremos 


1 0 0 l 4 1 2 4 
O 1 0 1 3ļ=]ļ|0 1 3 
0 -3 1 2 1 -4 2 -2 -13 


Este resultado é exatamente aquele que obtemos se somarmos à terceira linha 
de A a segunda multiplicada por -3. 

Através desses exemplos podemos perceber que existe uma relação íntima 
entre as operações com linhas de uma matriz e certas matrizes especiais cons- 
truídas a partir da matriz identidade. Estas matrizes serão denominadas matri- 
zes elementares, 


3.8.2 Definição: Uma matriz elementar é uma matriz obtida a partir da 
identidade, através da aplicação de uma operação elementar com linhas. 


O relacionamento entre matrizes elementares e operações com linhas é 
dado pelo teorema abaixo. 


3.8.3 Teorema: Se A é uma matriz, o resultado da aplicação de uma ope- 
ração com as linhas de A é o mesmo que o resultado da multiplicação da ma- 
triz elementar E correspondente à operação com linhas pela matriz A. 


A prova deste resultado poderá ser feita por você. Consiste apenas em 
escrever a matriz E, efetuar o produto E» A e verificar que o resultado obti- 
do é o esperado. Este procedimento deve ser efetuado para cada tipo de opera- 
ção com linhas. Uma consequência importante da proposição anterior é: 


3.8.4 Corolário: Uma matriz elementar E, é inversível e sua inversa é a 
matriz elementar E,, que corresponde à operação com linhas inversa da opera- 
ção efetuada por E,. 


Por exemplo, se E, é a matriz elementar cuja operação consiste em mul- 
tiplicar uma determinada linha por k, a matriz inversa de E, será a matriz ele- 


mentar E, que corresponde à operação de multiplicar a mesma linha por + A 


prova deste corolário é deixada a seu encargo. 
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Como consequência do resultado anterior, podemos mostrar agora o teo- 
rema 2.3.1. 


3.8.5 Teorema: Sistemas associados a matrizes linha equivalentes são equi- 
valentes. 


Prova: Sejam A e A' matrizes-linha equivalentes. Por 3.8.3 
A' = MA, onde M é um produto de matrizes elementares e, portanto, inver- 
sível (veja 3.8.4 e (i) de 3.5.4). Os sistemas (I) e (II) que têm A e A” como 
matrizes ampliadas podem ser escritos respectivamente: 

N.X=BeNX=B', onde N é a submatriz de A da qual se retirou a 
última coluna e B é esta coluna. (idem para Nº, A' e B'.) Além disto, você po- 
de verificar que 

N=M.NeB'-M-B. 


Portanto, NX = B > MNX = MB === NX = B'. 
Isto significa que os sistemas (1) e (II) são equivalentes pois toda matriz 


x 
X=| : | que seja a solução do I será solução de II e vice-versa. 


Xn 


3.8.6 Usando os resultados 3.8.3 e 3.8.4 podemos também completar 
agora a demonstração da observação (ii) de 3.5.4. Repetindo-a da maneira co- 
mo foi enunciada: Se A é uma matriz quadrada e existe uma matriz B tal que 
BA = 1, então A é inversível, ou seja, A"! existe e B = A”! Já havíamos mos- 
trado que se A é inversível, então B = A”!. Mostremos agora que A é realmen- 
te inversível, 

Comecemos analisando o sistema de equações lineares que corresponde a 
AX = 0, onde X é um vetor coluna e O é o vetor-coluna cujos elementos são 
nulos. Observamos que a única solução possível para esse sistema é X = O pois, 
multiplicando AX = O por B, temos O = B - O = B(AX) = (BA)X = IX = X. 
Por outro lado, se resolvermos o sistema AX = O através de operações com li- 
nhas, obteremos um sistema equivalente RX = 0, onde R é a forma escada li- 
nha reduzida de A e, portanto, R = EkEk -1 ... E, A. Mas, como o sistema 
RX = 0 é equivalente a AX = 0, a sua única solução é X = 0, e como R está 
na forma escada linha reduzida, a única possibilidade é R = I. Então 


l = EkEx., ... E1 A, e, multiplicando sucessivamente por Ej', Ex, E cia 
(que são matrizes elementares, como vimos na seção 3.8.4), teremos 

_ g-ig! - ; - 
A=E/'E;'.. E;', ou seja, A é um produto de matrizes elementares e, pela 


observação (i) de 3.5.4, é inversível. 
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* 3.9 PROCEDIMENTO PARA A INVERSÃO DE MATRIZES 


Com argumentos análogos aos usados em 3.8.5 você pode provar o teorema enun- 
ciado a seguir. 


3.9.1 Teorema: Se A é uma matriz inversível, sua matriz-linha reduzida à 
forma escada, R, é a identidade. Além disso, A é dada por um produto de ma- 


trizes elementares. 


A recíproca deste resultado irá fornecer um novo processo para se calcular 
a inversa de uma matriz A. Suponhamos que, ao reduzir A à forma escada linha 
reduzida, a matriz identidade seja obtida como resultado. Neste caso, como a ca- 
da operação com linhas corresponde uma multiplicação por uma matriz elementar, 
E;, teremos então: 
E,- E-A 
“E - E, - DA 


I= Eg - Ex 
= (Ex - Ep. 

Mas isto quer dizer que 
Ez Ex e E E. 1=A" 


que podemos colocar em palavras através do teorema abaixo. 


3.9.2 Teorema: Se uma matriz A pode ser reduzida à matriz identidade, 
por uma sequência de operações elementares com linhas, então A é inversível e 
a matriz inversa de A é obtida a partir da matriz identidade, aplicando-se a 
mesma sequência de operações com linhas. 

Na prática, operamos simultaneamente com as matrizes A e I, através de 
operações elementares, até chegarmos à matriz I na posição correspondente à 
matriz A. A matriz obtida no lugar correspondente à matriz I será a inversa dê 
A. 

(A : D — (I : A`’) 


Vejamos como este procedimento pode ser colocado em prática. 


3.9.3 Exemplos 


Exemplo 1: Seja 


i 
— 
we- O 


Coloquemos a matriz junto com a matriz identidade e a 
com linhas, para reduzir a parte esquerda (que correspo 
da linha reduzida, lembrando que cada operação deve s 


mente na parte direita. 


e E e 


O-O- 


Ia 


v =- o 


So0o0om- 


Trocando a primeira e segunda linhas, obtemos 


HO 


Agora, somamos à quarta 


por -2. 


l 
0 
0 
0 


SSD om 


So-o 


a primeira e à 


0 
1 
| 
0 


-1 
2 
l 

~l 


-l 
-1 


t 
t 
| 
l 
l 
| 
l 
1 
1 
t 


Sono 


Oo. o 


ooo 
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O- oo 


So- So 


Pliquemos as operações 
nde a A) à forma esca- 


er efetuada simultanea- 


=- 0O oo 


-ooo 


segunda, a primeira linha multiplicada 


-000o 


= 000 


Trocamos o sinal da terceira linha e, subsequentemente, anulamos o resto da 


terceira coluna. 


Soom- 


Sono 


O= So 


3 
4 
-3 
1 


-1 
1 
1 


-1 

2 
-2 
-l 


-1 
-2 
-1 
-1 


0 
0 
0 
| 
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Finalmente, obtemos a identidade à esquerda e a inversa de À à direita. Para isso, queremos que você descubra qual é o determinante de uma matriz 
elementar E nos seguintes casos: 


1000 l 3 3 3 2 i) E é obtida de I por uma permutação de linhas. 
o1 0 OS 6 2 4 ii) E é obtida de l pela multiplicação de j 
uma das 1 
O O | a: a E P pticaç as linhas por uma constante 
0001! 1i -1 -1 1 Ga m iA PON 
iii) E é obtida de I pela substituição da i-ésima linha por k vezes a j-ésima 
Portanto mais a i-ésima linha. i 
Agpra você deverá provar O seguinte resultado. 
3 -3 -3 2 
-5 6 2 A 
-1 
Rd, 128 3 
RR E 3.9.5 Teorema: Se E for uma matriz elementar e A uma matriz qualquer 
da mesma ordem que E, então det EA = det E - det A. 
Exemplo 2: Seja 
Para provar este teorema, considere as três possibilidades para a matriz E 
e (i), (it) e (iii) dadas acima. Tudo ficará realmente simples se você tiver chegado 
E aad à conclusão que, em (i) temos det E = -1, em (ii) det E = k e em (ii) det E = 1. 
020 Finalmente, podemos demonstrar a propriedade do determinante do pro- 
duto. 
Partimos de 
l 
1 0 E ip AD Ọ 
1 2 1101 0 3.9.6 Teorema: Se A e B são matrizes n X n quaisquer, então 
020 l 0 01 det(A - B) = det A - det B. 


e fazemos operações com linhas, para converter a parte esquerda (que corres- Prova: 


ponde a A) à forma escada linha reduzida. Obtemos então o Ra a PON Fal 
1º caso: Se A ou B são não inversíveis, temos A - B não inversível (veja o 


Exercício 10 da seção 3.10). Neste caso, det (AB) = 0, e como det A = O ou 
det B = 0, a igualdade se verifica. 


2 caso: Se A e B são inversíveis, usando 3.9.1 temos: 


01 
Como a forma escada não é a identidade, a matriz A não tem inversa. 
Após sucessivas aplicações do teorema 3.9.5 chegamos a: 


det (AB) = det E; - det (E, ... EkB) 

=... = det E, - detE, +... det E; - det B 
det E, - ... » det (Ez; - Ex) - det B 
$ = det (E; + Ez +... - Ex). det B 
conforme nos propusemos a fazer em 3.3 (viii). = det A » det B 


3.9.4 Agora, iremos demonstrar a propriedade 
det (AB) = det A - det B 


| 


lt 
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3.10 EXERCICIOS 


1. Dê o número de inversões das seguintes permutações de 1, 2, 3, 4,5: 


a)35412 

b)2 1435 

c)54321 

d) No determinante de uma matriz 5 X 5, que sinal (negativo ou posi- 
tivo) precederia os termos 4/3225434441452 € Gis 024033042451? 


2. Quantas inversões tem a permutação (nn-1... 2 1) dos números di 2a 


n-1, n? 
2 0 + 
3. Calcule det |3 0 2 
4 -3 7 


a) pela definição 
b) em relação à segunda coluna, usando o desenvolvimento de Laplace. 


4. Dadas as matrizes À = $ a eB= É E calcule 


a) det A + det B 
b) det (A + B) 


Un 


. Sejam A e B matrizes do tipo n X n. Verifique se as colocações abaixo são 

verdadeiras ou falsas. 

a) det (AB) = det (BA) 

b) det (A) det A 

c) det (2A) = 2 det A 

d) det (A?) = (det A)? 

e) det Ay < det A 

f) Se A é uma matriz 3 X 3, então 

á Âi tddi t lÂ = do Âz t an Ân t 423423 


4 


" 


2 3 12 
6. Dada A = i E : calcule 
3 -1 -2 4 
a) A23 c) A23 
b) [Ass] d) det A 


Determinante e Matriz Inversa 91 


7. Propriedade: O determinante de uma matriz triangular A, x, é igual ao pro- 
duto dos elementos de sua diagonal. 


a) Prove esta propriedade no caso em que A é uma matriz triangular supe- 
rior (genérica) 5 X 5. (Sugestão: Use e abuse do desenvolvimento de La- 
place.) 

b) O que você pode dizer sobre o número de soluções dos sistemas abaixo? 


a Sx; + 2x3 - 3x3 + 9x4 = 


0 
-3%, + 9x3 -4x =0 
0 
1 


$ (Ù 3 
E -2x4 + X4= 
A E 
À 3xs + 2x4 + X| = 0 
E - X3+t Xx- X=5 
É (ii) - 9x3 - x) + 9x, =0 
é 3 + 4=0 
B X1 = 0 
E 8. Calcule det A, onde 
k a) 3 -1 5 0 c) i 3 2 ~i 
a lO 2 0 1 da a l i 
q cos E RR SS o sale AO 
E b) 3 0 00 0 
x 19 18 00 0 
É A=|6 xz 50 0 
E 4 Vv2 V3 0 (0) 
É 8 3 5 6 + 
a 9. Encontre A~, onde 
a) 4 122 b) O -i -2 i 
|3 1 0 0 |}? -1 i 1l 
A=]3 31 0 Alg ainra 
0 7 1 1 1 1 l 0 
c) LO x 
A=|1 1 æ 
2. Dk 
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10. Se A ou B é uma matriz não inversível, então A « B também não é. Prove 
isto, sem usar determinantes. 


11. Mostre que 


x?  x+1 3 
aj a | e 
g “por mê 
2x 1 0 XxX x+1 3 x 0 x+1 3 
1 2-1 x|+]0 2 3 +|1 x-1 æ 
0 x -2 Q x -2 0 1 0 
Observe atentamente a igualdade acima e enuncie a propriedade que ela 
ilustra. 
2 1 -3 
12. Dada a matiz A=|0 2 1 | calcule 
5º da “3 
a) adj À 
b) det A 
o A 


13. Mostre que detja b cl|=(a-b)(b-c(e- a) 
2 


14. Dizemos que A e B são matrizes semelhantes se existe uma matriz P tal que 
B = P-!AP. Mostre que det A = detB se A e B são semelhantes. 


15. Verdadeiro ou falso? 


a) Se det A = 1, então AÍ = A. 

b) Se A é uma matriz triangular superior e A”! existe, então também A”! 
será uma matriz triangular superior. 

c) Se A é uma matriz escalar n X n da forma kl,, então det A = Rr 

d) Se A é uma matriz triangular, então det A = a t+... + änn- 


16. Resolva o sistema, usando a Regra de Cramer: 


x-2 + z=1 
2x + y =3 
y-52=4 


H 
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17. Dado o sistema 


xty -w= 0 
x -zt w= 2 

ytz- w=3 
x+y -2w = 1 


a) Calcule o posto da matriz dos coeficientes. 

b) Calcule o posto da matriz ampliada. 

c) Descreva a solução deste sistema. 

d) Considere um sistema homogêneo AX = 0, onde A é uma matriz n X n. 
Que condição você deve impor sobre A, para que o sistema admita solu- 
ções diferentes da solução trivial (X = 0)? Compare com 3.6 e o Exer- 
cício 18 do Capítulo 2. 


18. Prove que: Uma matriz A, com ordem 7, tem posto 7 se, e somente se A é 
inversível. 


19. A partir do exercício acima, você pode concluir que uma matriz A, de 
ordem n, possui determinante difereuic ae zero se, e somente se A tem n 
linhas linearmente independentes. Por quê? (Veja o final da secção 2.4.) 


20. Agora prove a propriedade 3.7.1, usando o exercício anterior. 


21. Mostre que a área do triângulo na figura é dada pelo determinante 


B (x3,y3) 


1 Xi yı 1 A (xi ya) 
z|% Já 1 
X3 ya 1 


C (x3, y2) 
22. a) Mostre que [1 a a? 


l a, aj=(a-a)(a;-a)(a;- a2) 
1 dz 3 
b) Se a1, à», ..., ap são números, mostre por indução finita que 
l ai af 
Va = Foca Q |. 0 Q- xi) 
: i<j 
E” EA + 


O símbolo à direita significa o produto de todos os termos x; - X; com 
i <j ei, j inteiros variando de 1 a n. 


94 


23. 
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Sugestão: Para efetuar facilmente a indução, multiplique cada coluna por 
x, e subtraia o mesmo da coluna imediatamente à direita, partindo do 
lado esquerdo, obtendo, então: Vy = (xy - x1)...(x2- x1) Vn-1- 

Tal determinante é chamado determinante de Vandermonde. 


Uma maneira de codificar uma mensagem é através de multiplicação por 
matrizes. Vamos associar as letras do alfabeto aos números, segundo a 
correspondência abaixo: 

CID|E|FIGHII 
3/4/5|6]7/819 


B 
2 


A X IY 
l 23/24 


VIW 
21/22 


PIQIRISI|TI|U 
15/16/17 [18/19/20 


JILIM|N|/O 
10/11/12/13/14 


Suponhamos que a nossa mensagem seja “PUXA VIDA”. Podemos formar 
uma matriz 3 X 3 assim: 


P U X 
A — V|, que usando a 
I D A 


correspondência numérica fica: 


15 20 23 
1 O 21]=M 
9 4 1 


Agora seja C uma matriz qualquer 3 X 3 inversível, por exemplo: 


1 0 1 
C=|-1 3 1 
O 11 


15 20 23 1 0 1 -5 83 58 
1 Oo 2lf+j-1 3 lj=|i 21 22 
9 4 1 O 1 1 5 13 14 


Transmitimos esta nova matriz (na prática, envia-se a cadeia de números 


-5 83 58 1 21 22 5 13 14). Quem recebe a mensagem decodifica-a 


através da multiplicação pela inversa ((M « C) + C7? = M) e posterior 
transcrição dos números para letras. C é chamada matriz chave para o 
código. 
a) Você recebeu a mensagem: 

-12 48 23 -2 42 26 1 42 29 

Utilizando a mesma chave traduza a mensagem. 


25 
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b) Aconteceu que o inimigo descobriu sua chave. O seu comandante manda 


1 1} -I 
você substituir a matriz chave por |1 1 0]. Você transmite a 
0 0 2 


mensagem “CRETINO...” a ele (codificada, naturalmente!). Por que não 
será possível a ele decodificar sua mensagem? 

c) Escolha uma matriz-chave que dê para codificar palavras até 16 letras. 
Codifique e descodifique à vontade! 


3.10.1 Respostas 


LOS 2 910 d-e+ 
3. a) 21 b) 21 


5, a) V b) V c) F d) V e) F NV 


7. a) Seja A uma matriz triangular superior e desenvolva-se o determinante 
através da primeira coluna. 
(Al = a, lA] mas Ay é triangular superior também lA! = anlAn! 
etc. 
Então lAl = Gn * a22 -.. inn- 


b) (i) única, (ii) nenhuma. 


9.a) |-1 -! 4 -2 
-3 -4 12 -6 
11 M -43 2 
10 14 -4 21 


b) -l - i -} -1 
-l -i i l-i 
2+i |l+2i l-i I 

3-1 -22-i 3-i 

c) -2 A 

1 E E 

4 -1+2 1-1 
x 

2 -1 

i 0 
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ł1. A derivada do determinante é a soma dos determinantes das matrizes obti- 
das da original, diferenciando as linhas, uma por uma, 


15. a) F b) V c) V d) F 
17. a) 3 c) Possível e indeterminado. 
b) 3 d) As linhas de A como vetores são LD. 


21. Considere as áreas do trapézio AXYC e dos triângulos AXB e CYB. 


23. b) A matriz-chave não tem inversa. 


Leituras Sugeridas e Referências 


!Herstein, T.N.; Tópicos de Álgebra, Editora Polígono, São Paulo, 1970. 
2Hoffman, K. e Kunze, R.: Álgebra Linear, Editora Polígono, São Paulo, 1971. 
3Lipschutz, S.; Álgebra Linear, McGraw-Hill do Brasil Ltda., Rio de Janeiro, 1971. 


ESPAÇO VETORIAL 


4.1 VETORES NO PLANO E NO ESPAÇO 


Imagine uma força atuando sobre um corpo. Você conseguirá precisá-la deter- 
minando sua intensidade e direção. Força é um exemplo típico de grandeza 
que será representada por um vetor. Outros exemplos são velocidade e deslo- 
camento. Neste capítulo desenvolveremos o conceito de vetor de uma forma 
bem ampla, de modo que, por exemplo, soluções de sistemas de equações li- 
neares ou de equações diferenciais também possam ser representadas por ve- 
tores. 


Figura 4.1.1 
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4.1.1 Vetores no Plano 


Inicialmente, introduziremos a idéia de vetor, restringindo-nos ao plano. 
Para isto, consideremos o plano cartesiano que consiste de um sistema de 
coordenadas dado por um par de retas ortogonais, com orientação. Fixada 
uma unidade de comprimento, um ponto P do plano pode ser identificado 
com o par (a, b) de números reais, que são suas coordenadas. 


Figura 4.1.2 


Dados dois pontos P e Q do plano, podemos considerar o segmento de 
reta orientado PQ, com ponto inicial P e ponto final Q. Note que embora co- 
mo conjunto de pontos os segmentos PQ e QP sejam iguais, como segmentos 
orientados eles são distintos. Diremos que eles são segmentos opostos. 

Vamos estabelecer que dois segmentos orientados são equivalentes se tive- 
rem o mesmo comprimento e direção. Por exemplo, na figura 


Figura 4.1.3 


=> + -> A y = “e AA : A 

PQ, KL e R$ têm a mesma direção; RT e KL têm o mesmo comprimento; PQ, 
-$ —+ 

RS e ZW têm o mesmo comprimento, mas os únicos segmentos com orienta- 


—+ -> 
ções equivalentes são PQ e RS. Para qualquer segmento orientado no plano exis- 
te outro equivalente a este cujo ponto inicial é a origem. Por exemplo, 
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Figura 4.1.4 


Vamos passar a considerar agora, apenas os segmentos orientados com 
ponto inicial na origem, denominados vetores no plano. E importante notar que 
vetores no plano são determinados exclusivamente pelo seu ponto final, pois o 
ponto inicial é fixo na origem. Assim, para cada ponto do plano P(a, b), está 
associado um único vetor v = oÈ e, reciprocamente, dado um vetor, associamos 
um único ponto do plano, que é o seu ponto final. Isto é, a correspondência 
entre pontos do plano e vetores é biunívoca. 

Usando esta correspondência entre vetores e pontos do plano, costumamos 
representar um vetor V = oÈ pelas coordenadas do seu ponto final P(a, b). 


. Ju : - - 
Usamos a notação da matriz-coluna v = [ a! ou mesmo a identificação 


v = (u, b). Por exemplo, v = E ou v = (t, 3). Observe que, deste modo, à 


origem do plano ficará associado um vetor que tem os pontos inicial e final 
coincidentes com esta. Denominaremos tal vetor (que é só um ponto) de vetor 
nulo, e este será representado por (0, 0). E 

O oposto de um vetor v = OP é o vetor w = OQ, que tem o mesmo 
comprimento e direção oposta. Em termos de coordenadas, se v = (a, b), então 
w = (~a, -b) e, por essa razão, denotamos W = —v. 


4.1.2 Operações com Vetores no Plano 


a) Multiplicação de um vetor por um número. 

Multiplicar um vetor v por um número k > O é considerar um novo ve- 
tor w = kv, que possui a mesma direção de v e tem como comprimento K ve- 
zes o comprimento de v. Se k < 0, o vetor w = kv será igual ao oposto do 
vetor ikl © v. Se k = 0, w = kv será o vetor nulo. 
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u=-3Y 


Figura 4.1.5 


Observe que a multiplicação de vetor por um número corresponde à multipli- 
cação da matriz-linha (ou coluna} por esse número. Assim, se v = (a, b) e 
w = ky, então w = (ka, kb). Por exemplo, para v = (2, -5), w = 3v = (6, -15). 

b) Adição de dois vetores. 

Para introduzir a soma de vetores, vamos voltar ao exemplo de forças 
atuando num corpo. Uma força que atua num ponto pode ser representada por 
um vetor, de comprimento igual à intensidade da força, com a mesma direção 
em que a força atua. (Estamos supondo que a origem do sistema de coordena- 
das está no ponto onde a força atua.) 

Suponhamos agora que temos duas forças F, e F, atuando no mesmo 
objeto. Podemos representar o resultado destas duas forças por uma única for- 


2 


ça R? Em outras palavras, o que é a “soma” de duas forças? 


Figura 4.1.6 


A experiência mostra que a força resultante é representada pelo vetor diagonal 
do paralelogramo construído a partir dos vetores F} e F}. Chamamos a força 
resultante de soma de F; com F, e denotamos R = F, + F,. Agora, pensemos 
em termos de coordenadas. Se F; = (a, b) e F, = (c, d), quais são as coordena- 
das de R? 


Figura 4.1.7 
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Usando congruência de triângulos, você pode notar que as coordenadas de R 
são (a + c, b + d). l 
Foram resultados como este que motivaram a definição formal de soma 
de dois vetores no plano. Se v = (a, b) e w = (c, d), então o vetor-soma será 
v+ w= (a +c, b + d). Observe que somar vetores corresponde simplesmente a 
somar as matrizes que os representam. As operações entre vetores herdam, por- 
tanto, todas as propriedades das operações correspondentes para matrizes. 
Podemos ainda observar que a soma de um vetor v = (a, b) com seu 
oposto w=-v=(-a, -b) é o valor nulo. Isto é, v +w =v +(-v)=(a -a, 
b - b) = (0, 0). o 
Por diferença entre dois vetores v e w, entendemos a soma do primeiro 
com o oposto do segundo vetor, v - w = V + (-w). Isto é mostrado geometrica- 
mente, pela Figura 4.1.1. 


Figura 4.1.8 


4.1.3 Vetores no Espaço 


Da mesma forma que fizemos no plano, podemos considerar vetores no espaço. 
Teremos então um sistema de coordenadas dado por três retas orientadas, per- 
pendiculares duas a duas, e, uma vez fixada uma unidade de comprimento, cada 
ponto P do espaço estará identificado com a terna de número reais (x, y, z), 


que dá suas coordenadas. 


Figura 4.1.9 
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Também aqui os vetores são dados por segmentos orientados, com ponto 
inicial na origem, e existe uma correspondência biuniívoca entre vetores e pon- 
tos do espaço que a cada vetor OP associa seu ponto final P = (a, b, c). Deste 


= 
modo, o vetor v = OP costuma ser denotado pelas coordenadas de P. 


ou v= (a, b, c) 


< 
| 
a 


Exemplo 


Figura 4.1.10 


A origem fixada para o espaço representará o vetor nulo (0, 0, 0). 
Assim, se chamarmos de V o conjunto de vetores no espaço, podemos 


identificar 
(xi, x2, X3); x; E R} 


RX RX R=Rº 


V 


11 


4.1.4 Operações com Vetores no Espaço 
A soma de dois vetores e o produto de um vetor por um número (escalar) 
também são definidos da mesma forma que no plano 
Se u = (X1, X2, X3) € v= Qi, X2, Ya), 
utv=(M +y X ft) X3 t y3) 
e ku = (kx, kxo, KX3) 
Por exemplo, se u = (2, -3, 5) e v = (1, 2, 0), u + v = (3, -1, 5) e 
2u = (4, -6, 10). 


Como já observamos no caso do plano, estas operações correspondem exa- 
tamente às respectivas operações das matrizes-linha que representam os vetores 


e gozam de uma série de propriedades decorrentes daquelas relativas às ope- 
rações com números reais. 
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Propriedades: 
)(lu+wWtw=u+(v+w) 
üj ut+v=vtu 
ti) Existe 0 € V tal que u + 0 = u. (0 é chamado vetor nulo.) 
iv) Existe -u € V tal que u + (-u) = 0. 
v) a(u+v)=autav 
vi) (a + b)v =av + bv 
vä) (ab)v = a(bv) 
vii) lu=u 


Estas propriedades servirão para caracterizar certos conjuntos que, apesar 
de terem natureza diferente dos vetores no espaço, “comportam-se” como eles. 
Estes conjuntos receberão o nome de espaços vetoriais. 


4.2 ESPAÇOS VETORIAIS 


4.2.1 Definição: Um espaço vetorial real é um conjunto V, não vazio, 
com duas operações: soma, V X V—>5 V, e multiplicação por escalar, 
R X V— V, tais que, para quaisquer u, v, w€ V ea, b € R, as proprieda- 
des de 1) a viii) sejam satisfeitas. 


Se na definição acima, ao invés de termos como escalares, números reais, 
tivermos números complexos, V será um espaço vetorial complexo. 


Usaremos doravante a palavra vetor para designar um elemento de um 
espaço vetorial. Assim, por exemplo, se considerarmos o espaço vetorial 
V = M(2, 2), os vetores serão matrizes. (Mostre que M(2, 2) realmente é um 


espaço vetorial, verificando as condições indicadas na definição 4.2.1. Lembre 
que os vetores u, v e w deste espaço vetorial são matrizes 2 X 2 e os escalares 


ainda números reais.) Agora, convém introduzir alguns exemplos de espaços 
vetoriais. 


4.2.2 Exemplos 
Exemplo 1: O conjunto dos vetores do espaço 
V = R? = {(%1, X2, X3); x; € R} 


é evidentemente um espaço vetorial real (veja 4.1.3). 
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Exemplo 2: No lugar de ternas de números reais consideremos como ve- 
tores n-uplas de números reais. 


V = R” = Kx, Xs e Xn) Xi E R} 


e se u = (Xi, X2, ṣo Xn) Y = Qis Yz, os Yn) ea ER, 

u+ v= (xi + yi, E) Xn t Yn) e au = (ax, 4X2, aXn) 
Neste caso perdemos, é claro, a visão geométrica de “vetores”, pois saímos de 
um espaço de “dimensão” 3 da geometria e passamos a um espaço de “dimen- 
são” n. Apesar disto, podemos trabalhar com estes espaços da mesma maneira 
que em Rº. 


Subexemplo: n=5; V=R* 
V = {xi, X2, X3, Xas Xs): XE R} 
Se u = (1, 0, 2, -3, 4) 
e v = (0, 1, 1, -2, 5), 
então u - 2v = (1, 0, 2, -3, 4) - 2(0, 1, 1, -2, 5) 
= (1, 0, 2, -3, 4) - (0, 2, 2, -4, 10) 
= (1, -2, 0, 1, -6) 
Observe que, neste caso, o vetor nulo é (0, 0, 0, 0, 0). 
As n-uplas de números reais Ou, equivalentemente, matrizes-linha IXan 
(ou matrizes-coluna n X 1) aparecem naturalmente na descrição de muitos pro- 
blemas que envolvem várias variáveis. Como um exemplo para determinar a po- 
sição de uma barra no espaço precisamos dar as coordenadas de suas duas 
extremidades A = (4,, 4», 43) e B = (by, b2, ba). Assim, sua coordenada será 
dada por (44, 43, 43 bi, Da, bs), e estaremos trabalhando com o espaço veto- 
rial RÉ. 
Exemplo 3: V = M(m, n), o conjunto das matrizes reais m X n com a 
soma e produto por escalar usuais. 


Subexemplos: 
i) V=MQ,2)= É ia bc d ER 


Qual é o vetor nulo deste espaço vetorial? (Veja o Exercício 1 da secção 
4.8.) 

ii) V = MO, n) = lay dio Gn]: aii e R}. 
Observe que este espaço vetorial pode ser identificado com V = R" (veja 
o Exemplo 2 desta seção). 
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E. e x = 1 a A : 
ás xemplo 4: V = Pn, o conjunto dos polinômios com coeficientes reais, 
i grau menor ou igual a n (incluindo o zero). As operações são soma de po- 
linômios e multiplicação destes por números reais 


Subexemplo: n = 2 
P, = {ao tax + ax’: aj ER}. 


Todos os exemplos anteriores foram de espaços vetoriais reais. O próximo 
exemplo é de um espaço vetorial complexo. 


Exemplo 5: V é o conjunto das matrizes 2 X 2, cujos elementos são nú- 
meros complexos. As operações são adição de matrizes e multiplicação destas 
por números complexos. 


Exemplificando: 
7 + i 0 4 2 0 E 9 +i 0 
2 -i 2+i i 4+i 0 
2 


; i i-l 2+2i 
Fë = 
TEW aa ra 0 


Os espaços complexos aparecem, por exemplo, no estudo de sistemas de 
equações diferenciais. (Veja o Capítulo 12.) Salvo menção em contrário, todos 
os espaços vetoriais que abordaremos a seguir serão espaços vetoriais reais. 


4.3 SUBESPAÇOS VETORIAIS 


Às vezes, é necessário detectar, dentro de um espaço vetorial V, subconjuntos 
W que sejam eles próprios espaços vetoriais “menores”. Tais conjuntos serão 

chamados subespaços de V. Isto acontece, por exemplo, em: V = R?, o plano 
onde W é uma reta deste plano, que passa pela origem. 


Figura 4.3.1 
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Veja que a reta W funciona sozinha como espaço vetorial pois, ao somarmos 
dois vetores de W, obtemos um outro vetor em W. Da mesma forma, se mul- 
tiplicarmos um vetor de W por um número, o vetor resultante ainda estará em 
W. Isto é, o subconjunto W é “fechado” em relação à soma de vetores e à 
multiplicação destes por escalar. Estas são as condições exigidas para que um 
subconjunto W de um espaço vetorial V seja um subespaço. 


4.3.1 Definição: Dado um espaço vetorial V, um subconjunto W, não va- 
zio, será um subespaço vetorial de V se: 
i) Para quaisquer u, v E W tivermos u + v E W. 
ii) Para quaisquer a E R, u E W tivermos au E W. 


Podemos fazer três observações: 

a) As condições da definição acima garantem que a0 operarmos em W (soma 
e multiplicação por escalar), não obteremos um vetor fora de W. Isto é 
suficiente para afimar que W é ele próprio um espaço vetorial, pois assim 
as operações ficam bem definidas e, além disso, não precisamos verificar 
as propriedades de (i) a (viii) de espaço vetorial, porque elas são válidas 
em V, que contém W. 

b) Qualquer subespaço W de V 


(por causa da condição (ii) quando a = 0). 
c) Todo espaço vetorial admite pelo menos dois subespaços (que são chama- 


dos subespaços triviais), o conjunto formado somente pelo vetor nulo (ve- 
rifique (i) e (ii) e o próprio espaço vetorial. 


precisa necessariamente conter o vetor nulo 


4.3.2 Exemplos 
Exemplo 1: V = R? e W © V, um plano passando pela origem. 


Figura 4.3.2 


Veja geometricamente a validade de (i) e (ii).. Observe que se W não 
passasse pela origem, não seria um subespaço. Note que na verdade os úni- 
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cos subespaços de R? são a origem, as retas e planos que passam pela ori- 
gem, e o próprio Rº. 


Exemplo 2: 4 = R5 e W= {(0, x, X3, xs, xs); x; E€ R} 
Isto é, W é o conjunto dos vetores de R5, cuja primeira coordenada é nula 
Verifiquemos as condições (i) e (ii). l 


i) u = (0, Xa Xa} Xa Xs), V = (0, Ya, Ya, Ya Y) EW 
Então u + v = (0, X2 +t Yz X + Yz X4 t Ya X5 + ys} que ainda 
pertence a W, pois tem a primeira coordenada nula. 

ü) ku = (0, kx, kX3, KX4, kxs) E W, pois a primeira coordenada é nula 
para todo k ER. 


». Portanto, W é um subespaço vetorial de R5. 


Exemplo 3: V = M(n, n) e W é o subconjunto das matrizes triangula- 


; Tes superiores. W é subespaço, pois a soma de matrizes triangulares superiores 


ainda é uma matriz triangular superior, assim como o produto de uma matriz 


+ triangular superior por um escalar. 


Exemplo 4: Uma situação importante em que aparece um subespaço é 


* obtida ao resolvermos um sistema linear homogêneo. Por exemplo 


2x +t 4y + z=0 
x+ y+22=0 
xt3y- z=0 


i Observe que, se colocarmos este sistema na forma matricial, teremos 


Desta forma, estamos procurando, dentro do espaço vetorial M(3, 1) 


À das matrizes-coluna de 3 linhas, aqueles vetores que satisfazem a relação (*), 
|: isto é, aqueles vetores-solução do sistema. Queremos saber se o conjunto dos 

; Vetores-solução é um subespaço de M(3, 1). Para isto, teremos que tomar 

j dois vetores-solução. 


x) Xz Xi X, 
yı| e | yal, e verificar se sua soma |y| +] y: 
Zi Z2 Zi Z2 
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ainda é um vetor-solução. Então 


2 4 1 X1 X2 2 4 1 X1 2 4 1 Xa 
vor o 2flefiy] + jy/]= 1 1 2f yf +i 1 2i [j2 
j! 3 -1 Zi Z2 3 -l Zi 1 3 -] Z2 
0! 0 0 
=/0]+1I0/=10 
0 0 0 
xı 
Isto é, a soma é solução. Além disso, se multiplicarmos | yı | por uma cons- 
Zi 
tante k, teremos 
2 4 1 Xı 2 4 1 X1 0 (0) 
1 1 2 klyl Jj=kį||1 1 2 yull=k/0]=1|0 
1 3 -l Z 1 3 -l Z1 0 0 


Isto é, o produto de uma constante por uma solução ainda é uma solução. Por- 
tanto, o conjunto W dos vetores-solução de (*) é um subespaço de M(3, 1). 
(Considerando a identificação M = (3, 1), como Rº, W pode ser dado geometri- 
camente pela intersecção dos três planos no espaço descritos por cada uma das 
equações de (*).) 


Exemplo 5: O conjunto-solução de um sistema linear homogêneo de n 
incógnitas é um subespaço vetorial de M(n, 1). Tente provar isto. 
Alguns exemplos em que W não é subespaço de V são os seguintes: 


Exemplo 6: V = R?, onde W é uma reta deste plano que não passa pela 
origem. 


Figura 4.3.3 
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w não é subespaço de V, pois existem u e v em W, tal que u + v ¢ W. Outra 
maneira de ver que W não é subespaço de V é notar que o vetor nulo não 
pertence a W. (Veja a observação b em 4.3.1.) 

i Este último fato é usado freqüentemente para determinarmos que UC V 
não é subespaço de V, isto é, sempre que 0 Ẹ U, podemos afirmar E U não é 
subespaço de V. Mas, cuidado: Não vale a recíproca, pois podemos pe 0EU 
sem que U seja subespaço, como mostra o exemplo seguinte. 


Exemplo 7: V = R? e W= [(x, x?); x E€ R}. Se escolhermos u = (l, 1)e 
ya (2, 4), temos u + v = (3, 5) & W. Assim, W não é subespaço vetorial de V 
pois, caso contrário, a condição (i) deveria ser satisfeita para quaisquer u e v E 
€ W, e isto não ocorre neste exemplo. , 


to, 0) Ew 
Figura 4.3.4 


Exemplo 8: V = M(n, n) e W é o subconjunto de todas as matrizes em 
que an S O. Mostre que a condição (i) é satisfeita, mas (ii) não é: portanto 
W não é um subespaço. l l 


Exemplo 9: Se um sistema linear não for homogêneo, o que acontece 
com seu conjunto-solução? Considere o exemplo: 


2x + 4y + z 
C) J xt y+ 
xt 3y- z 


Do 
= = 


0 


Prove que a soma de dois vetores-solução nem sempre é um vetor-solução, e 
assim o conjunto-solução não é um subespaço de M(3, 1). (Veja o Exercício 
17 da secção 4.8.) 

Embora nos Exemplos 6 e 9, W não seja subespaço, ainda assim ele é um 
subconjunto especial que recebe o nome de variedade linear. Estudaremos me- 
lhor este tipo de subconjunto em 4.9. O Exemplo 7 não é uma variedade linear. 
Agora veremos as principais propriedades dos subespaços. 


Biblioteca de ' 
Ciência & Tecnol 
z l rn m 
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4.3.3 Teorema: (Intersecção de subespaços): Dados W, e W, subespaços 

de um espaço vetorial V, a intersecção W, N W, ainda é um subespaço de V. 

Prova: Observamos inicialmente que W, N W, nunca é vazio pois ambos os 

subespaços contêm o vetor nulo de V. É necessário verificar então as condições 

i) e ii) para mostrar que W, N Wz também é subespaço vetorial de V. 

i) Dados x, y E W, N Wz, x e y pertencem a W;, e também a W,. Então, 
x+yeWex+y€ Wh, sendo W, e W, subespaços de V. Portanto, 
x+y EW AW. 

ii) Agora, você deverá provar a segunda condição como um exercício. 


4.3.4 Exemplos 


Exemplo 1: V = R? 
W, N W3 é a reta de interseção dos planos W, e Wa. 


Figura 4.3.5 


Exemplo 2: V = M(n, n) 
W, = {matrizes triangulares superiores} 
W, = {matrizes triangulares inferiores} 
Então W, N W, = {matrizes diagonais). 
Uma vez que a interseção de dois subespaços ainda é um subespaço veto- 
rial, poderíamos esperar o mesmo da reunião. Mas isto não acontece, como po- 
demos ver no próximo exemplo. 


Exemplo 3: V = R? 


Wa 


Figura 4.3.6 
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W, e W, são retas que passam pela origem. Então, W) N Wi = {0} e W, U W: 
é o “feixe” formado pelas duas retas, que não é subespaço vetorial de Rº. De 
fato, se somarmos os dois vetores u e v, pertencentes a W, U Wz, vemos que 
u + v está no plano que contém W, e W, mas u + v € W, U W2. 

Assim, W, U W, não é subespaço de V. Entretanto, podemos construir 
um conjunto W, que contém W, e W, e é subespaço de V. W será formado 
por todos os vetores de V que forem a soma de vetores de W, com vetores de 
W. W= W, + W, será chamado “soma de W, e W,”. Será conveniente colocar- 
mos esta afirmação de forma mais precisa. 


4.3.5 Teorema: (Soma de subespaços): Sejam W, e W, subespaços de um 
espaço vetorial V. Então, o conjunto 


W+W=(VEViv=wtw,wW E W, e w, E W,) é subespaço de V. 
Prova: (Veja o Exercício 23 da secção 4.8.) 
4.3.6 Exemplos 


Exemplo 4: No exemplo anterior, W= W, + W, é o plano que contém 
as duas retas. 


wi 


Wi + Wi 


Figura 4.3.7 


Exemplo 5: Se W, C R? é um plano e W, é uma reta contida neste pla- 
no, ambos passando pela origem, W, + W = Wi. 


Figura 4.3.8 
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a b o 0 
: = = E . 
Exemplo 6: W, E ol} e W, E J} onde a, b,c, d ER 
x a b 
Então W, + W, |: dia M(2, 2). 


Quando W; N Wz = {0}, então W, + W, € chamado soma direta de W, 
com W,, denotado por W, 6 W3. Os Exemplos 4 e 6 são exemplos de soma 
direta, e um contra-exemplo é dado no Exemplo 5. Observe que tanto no Exem- 
plo 1, como no 2, temos que o espaço todo V= W, + Wz, mas a soma não é 
direta. 


4.4 COMBINAÇÃO LINEAR 


Vamos comentar, agora, uma das características mais importantes de um espaço 


4 


vetorial, que é a obtenção de novos vetores a partir de vetores dados. 


4.4.1 Definição: Sejam V um espaço vetorial real (ou complexo), 
Vi, Ya, o Vn E Vea, -~ dyn números reais (ou complexos). Então, o vetor 


V = aV tava te + lnYn 


é um elemento de V ao que chamamos combinação linear de vi, «o Va- 


Uma vez fixados vetores vi, -.., Yn em V, o conjunto W de todos os ve- 
tores de V que são combinação linear destes, é um subespaço vetorial. (Mostre 
isto como exercício.) W é chamado subespaço gerado por V, ..., Yn € usamos a 
notação 

W = [Vi vn) 


Note que, formalmente, podemos escrever 


W = [vi, p, Yn] = VEV, vy =4v +.. tavn 4i ER, |<i<n) 


s..s 


Uma outra caracterização de subespaço gerado é a seguinte: W = [v,,..., Va] 
é o menor subespaço de V que contém o conjunto de vetores (vi, <., Yn}, no senti- 
do de que qualquer outro subespaço W' de V que contenha (v,, ..., vp) satis- 
fará W' D W. (Mostre também esta afirmação como exercício.) 


4.4.2 Exemplos 


Exemplo 1: V = R? vE V, vo. 
Então [v] = {av: a E R}, isto é, [v] é a reta que contém o vetor v. 
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Figura 4.4.1 


Exemplo 2: Se v, v, E R? são tais que av, *# v, para todo « E R, então 
[v,, v2] será o plano que passa pela origem e contém v; € vz. 


Figura 4.4.2 


irá Figura 4.4.3 


pode ser escrito como combinação linear de vi, V2, Va é uma combinação linear 
apenas de v; € v; (pois v, é combinação linear de v; e v2). 


Exemplo 3: V = R?, v, = (1, 0), v2 = (0, 1). Logo V = [vi, vz] pois, da- 
do v = (x, y) E€ V, temos (x, y) = x(1, 0) + (0, 1), ou seja, v = xv, + yv. 


Exemplo 4: 


RES DE S S E E 
17 jo off ? jo o 


Então [v,, v2] = Ê bla dER 
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4.5 DEPENDÊNCIA E INDEPENDÊNCIA LINEAR 


Em Álgebra Linear, é fundamental sabermos se um vetor é uma combinação li- 
near de outros. No Exemplo 2 da seção anterior, o espaço gerado por vi, Y2, 
v3 é o mesmo que o espaço gerado por v,, vp. À razão disso é que v3 é um 
vetor “supérfluo” para descrever o subespaço, pois é uma combinação linear de 
vı e v}. No caso geral, dados os vetores Vi, Y2, -.., Vn, queremos saber se não 
existem vetores “supérfluos”, isto é, se algum desses vetores não é uma combi- 
nação linear dos outros. Para chegarmos a uma conclusão, precisamos começar 
definindo dependência e independência linear. 


4.5.1 Definição: Sejam V um espaço vetorial e vi, . Vn € V. Dizemos 
que o conjunto (vi, ..., Yn} é linearmente independente (LI), ou que os vetores 
Vi, =. Vy são LI, se a equação 

Vi Fat anYn = 0 
implica que a, = 4, =... = Gn = O. No caso em que exista algum a; + O dize- 
mos que (vi, ..., Vn} é linearmente dependente (LD), ou que os vetores 
Vi, Va São LD. 


Vetores linearmente dependentes podem ser caracterizados de uma outra 
maneira. 


4.5.2 Teorema: (v,, ..., Vn} é LD se, e somente se um destes vetores for 
uma combinação linear dos outros. 


Prova: 
Sejam vi, ..., Vn LD e 


Avi to tato. +anvn=0 


Segundo a definição dada, um dos coeficientes deve ser diferente de zero. Su- 
ponhamos que a; + O. Então 


1 
y= a (mv +... + GjaVja + ajraVjaa +. tann) 
J 
e portanto 
a q 
w=-— wi + Eva 
aj aj 


Logo, v; é uma combinação linear dos outros vetores. 
Por outro lado, se tivermos (vi, ..., Vj, - Vn} tal que para algum j, 


v= byy +. + bjj + bja fome o bnYn 
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temos 
biyi tanm ivy + +bava=0 com b;=-~l1 e, 
portanto, (vi, ..., Vn} é LD. 


Esta proposição também é equivalente a: Um conjunto de vetores é LI 
se, e somente se nenhum deles for uma combinação linear dos outros. 


4.5.3 Exemplos 


Exemplo 1: V = Rº. Sejam vs, v E V. 
lvi, v2} é LD se e somente se v; e v, estiverem na mesma reta, que passa pe- 
la origem. (v, = àvz). Veja a Figura 4.5.1. 


v2 
Figura 4.5.1 


Exemplo 2: V = Rº. Sejam vs, vo, Y3 E€ V. 
{Vi, Vo, Va) é LD se estes três vetores estiverem no mesmo plano, que passa 
pela origem. Veja a Figura 4.5.2. 


Figura 4.5.2 


Exemplo 3: V = R?, e, = (1, 0) e e2 = (O, 1). 
e; e e, são LI, pois 
ae, te, =0 
a(l, 0) + a,(0, 1) = (0, 0) 
(ai, 42) = (0, 0) 
a =0 e 0,=0 


116 ÁLGEBRA LINEAR 


Exemplo 4: De modo análogo, vemos que para V = R°, e, = (1, 0, 0), 
e, = (0, 1, 0) e e3 = (0, 0, 1). Então e;, e, e e; são LI. 


Exemplo 5: V = R? | | 
(1, -1), (1, 0), (1, 1)) é LD, pois 3 (1, -1) - 101,0) + zb 1) = (0, 0). 


4.6 BASE DE UM ESPAÇO VETORIAL 


Agora, estamos interessados em encontrar, dentro de um espaço vetorial V, 
um conjunto finito de vetores, tais que qualquer outro vetor de V seja uma 
combinação linear deles. Em outras palavras, queremos determinar um conjun- 
to de vetores que gere V e tal que todos os elementos sejam realmente ne- 
cessários para gerar V. Se pudermos encontrar tais vetores, teremos os alicerces 
de nosso espaço, com estes vetores fazendo o mesmo papel que i, j, k na Geo- 
metria Analítica no espaço. Denominaremos um conjunto de vetores desse tipo 
de base. 


4.6.1 Definição: Um conjunto {v;, ..., Yn} de vetores de V será uma ba- 
se de V se: 


i) (vi, 2... Vu) é LI 
iD M, Yn F 


4.6.2 Exemplos 


Exemplo 1: V = R?, e; = (1, O) e e, = (0, 1) 
je}, e3} é base de V, conhecida como base canônica de R?. (Veja o Exemplo 


, 


3 da seção 4.4.2 e o Exemplo 3 da seção 4.5.3.) 

O conjunto ((1, 1), (0, 1)) também é uma base de V = R?. De fato: 
Se (0,0) = a(l, 1) + b(0, 1) = (u, a + b), então a = b = 0. Isto é, {(1, 1), 
(0, 1)) é LI. 
Ainda |(1, 1), (0, 1)] = V pois dado v = (x, y) E€ V, temos 

(x, y) = x(1, 1) + Q - x)(0, 1) 

ou seja, todo vetor de R? é uma combinação linear dos vetores (1, 1) e (0, 1). 
Veja a Figura 4.6.1. 


(0, 1) 1,1) 


Figura 4.6.1 
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Exemplo 2: 
{(0, 1), (0, 2)) não é base de R?, pois é um conjunto LD. 
Se (0, 0) = a(0, 1) + b(0, 2), temos g = -2b ea e b não são necessariamente 
zero. Veja a Figura 4.6.2. 


(o, 2) 


Figura 4.6.2 
(0, 1) 


Exemplo 3: V = R? 
{(1, 0, 0), (0, 1, 0), (0, 0, 1)} é uma base de Rº. Esta é a base canônica de 
Rº. Podemos mostrar que 
i) (e, e», es) é LI e 
ii) (x, y, Z) = X€; + ye, + ze3 


Exemplo 4: 
{(1, 0, 0), (0, 1, 0)} não é base de Rº. É LI, mas não gera todo Rº, isto é, 
4,0, 0), (0,1, 0)] = Rº. 


Exemplo 5: V = M(2, 2) 


f ] É 1 É à É | é uma base de V. 


(Veja o Exercício 9 da secção 4.8.) 

Existem espaços que não têm base finita. Isto acontece principalmente 
quando trabalhamos com espaços de funções. Nestes casos, precisaremos de um 
conjunto infinito de vetores para gerar o espaço. Isto não quer dizer que esta- 
mos trabalhando com combinações lineares infinitas, mas sim, que cada vetor 
do espaço é uma combinação linear finita daquela “base infinita”. Ou seja, pa- 
ra cada vetor, podemos escolher uma quantidade finita de vetores da “base” 
para, com eles, escrever o vetor dado (veja o Exercício 16 da secção 4.8.). Nes- 
te texto, consideraremos sempre espaços vetoriais que tenham uma base finita. 


Para obter propriedades acerca das bases de um espaço, consideremos as 
proposições seguintes. 
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4.6.3 Teorema: Sejam Vi, va, -.., Yn vetores não nulos que geram um es- 
paço vetorial V. Então, dentre estes vetores podemos extrair uma base de V. 


Prova: Se vi, Y2, -.. Yn são linearmente independentes, então eles cumprem as 
condições para uma base, e não temos mais nada a fazer. Se vi, V2, -s Yn SãO 
linearmente dependentes, então existe uma combinação linear deles, com algum 
coeficiente não zero, dando o vetor nulo 


XV + XV te. + XpYn=0 


Seja, por exemplo, x, * O. Então podemos escrever 


=X =X -Xp 
Yn = — +v tv ++ Ely, 
Xn n Xn 
ou seja, Vp é uma combinação linear de v1, ..., Vn-1 e, portanto, Vi, V2, -e Vn-1 


ainda geram V. Se v,, ..., Vn-ı for LD, então existe uma combinação linear de- 
les dando o vetor nulo e com algum coeficiente diferente de zero; portanto, 
poderemos extrair aquele vetor que corresponde a este coeficiente. Seguindo 
desta forma, após uma quantidade finita de estágios, chegaremos a um subcon- 
junto de {v;, ..., Vn}, formado por r(r < n) vetores LI va, Viz, ..., Vir, que 
ainda geram V, ou seja, formaremos uma base. 


4.6.4 Teorema: Seja um espaço vetorial V gerado por um conjunto finito 
de vetores v;i, V2, ..., Yn. Então, qualquer conjunto com mais de n vetores é 
necessariamente LD (e, portanto, qualquer conjunto LI tem no máximo n veto- 
res). 


Prova: Como |v}, ..., vn] = V, pela proposição anterior, podemos extrair uma 
base para V de vi, ..., Vy. Seja vi, ..., Vp, r < n, esta base (para não complicar 
a notação). Consideremos agora wi, Wa, ..., Wm, M vetores de V, com m > n. 
Existem, então, constantes ij, tais que 


Wi =UnvVi Tava +... + ayvr 
W2 = 4V1 + dava To... + day 
(1) 
Wm=QmiVi TQmava t. + amrYr 
Consideremos agora uma combinação linear de w,, ..., Wm, dando zero. 


(2) O = xW, + XW Tt... +tXmWm 
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Substituindo as relações (1) em (2) e coletando os termos, obtemos 
O = (axi + aax +.. + ami Xm)vi + 
Ta taxa +. + Amam + 
+ (MpX tax +. + amrXm)Yr. 
Como vi, V2, ..., Vp são LI, então 


aiXi tank, +.. + UmiXm = 0 


airXi tazk +... + dmrXr =, 0 


Temos então um sistema linear homogêneo com r equações e m incógnitas 
Xis s Xm e, como r <n < m, ele admite uma solução não trivial, ou seja, 
existe uma solução com algum x; não nulo. Portanto Wis n Wm são LD. 


4.6.5 Corolário: Qualquer base de um espaço vetorial tem sempre o mes- 
mo número de elementos. Este número é chamado dimensão de V, e denotado 
dim V. 


A à r, 
Prova: Sejam Avi, ..., Vn} € (Wi, --, Wm} duas base de V. Como v,, ..., Vn 
geram Ve wi, ..., Wm São LI, pela proposição anterior, m < n. 

Por outro lado, como w4, ..., Wm geram V e Vi, =s Yn São LI, ainda pe- 


lo teorema anterior, n < m. Portanto, n = m. 


4.6.6 Exemplos 


Exemplo 1: V = R? 
{(1, 0), (0, 1)} e {(1, 1), (0, 1)) são bases de V. Então dim V = 2. 


Exemplo 2: dim R? = 3, 


Exemplo 3: V = M(2, 2). 
Como vimos no Exemplo 5 da seção 4.6.2, uma base tem 4 elementos. Então 
dim V = 4, 

Quando um espaço vetorial V admite uma base finita, dizemos que V é 
um espaço vetorial de dimensão finita. 


4.6.7 Teorema: Qualquer conjunto de vetores LI de um espaço vetorial V 
de dimensão finita pode ser completado de modo a formar uma base de V. 


Prova: Seja dim V = n e v,, ..., vp vetores LI. (Observe que, pelo teorema 
4.6.4, r < n.) Se [vi, ..., vw] = V, então {v;, ..., v,) forma uma base, e não 
temos mais nada a fazer (neste caso, n = r). 
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Se existe v,, E€ V tal que v;a & lv, .... v,], isto é, Vy+ı não é uma 
combinação linear de Vi, ..., Vr, então (Vi, Vz. .., Vr, Vra} É LI (prove isto:). 
Se lv vo, o Vps Ya] = F, então (vy, ... W,1) é a base procurada. Caso con- 
trário, existe Vp, É Ivy, ..., Vrsn] e, então, {vi. io, VYr+1, Vroa) é LI (prove 
isto!). Se Lvi, ..., Vrs1, Vr+2] nossa prova está concluída. Se não, prosseguimos 
usando o mesmo argumento. Como não podemos ter mais do que n vetores LI 
em V (veja o teorema 4.6.4), após um número finito de passos teremos obti- 
do uma base de V que contém os vetores dados, 

Um corolário muito aplicado desta proposição é 


4.6.8 Corolário: Se dim V = n, qualquer conjunto de n vetores LI forma- 
rá uma base de V. 


Prova: Se não formasse uma base, poderíamos completar o conjunto até formá- 
-la e dessa forma teríamos uma base com mais do que n vetores em V, o que 
é absurdo (veja 4.6.5). 


Por exemplo, se você souber que a dim V = 2, e encontrar um conjunto 
de dois vetores LI, você pode afirmar que ele é uma base e portanto gera V. 

Uma proposição que relaciona as dimensões de subespaços de um espaço 
vetorial é dada a seguir. 


4.6.9 Teorema: Se U e W são subespaços de um espaço vetorial V que 
tem dimensão finita, então dim U < dim V e dim W < dim V. Além disso, 


dim(U + W) = dim U + dim W - dim(U N W) 


A demonstração desta proposição é feita tomando-se bases para U e W, juntan- 
do-as, obtendo um conjunto de vetores que gera U + W e depois estudando 
quantos são necessários extrair para se obter uma base para U + W. Deixamos 
você fazer esta prova, recomendando que resolva primeiro os problemas 27 e 

28 da secção 4.8. É um bom exercício ! 


O resultado a seguir nos permitirá falar em coordenadas de um vetor. 


4.6.10 Teorema: Dada uma base $ = (vi, Y2, -~ Yn} de V, cada vetor de 
V é escrito de maneira única como combinação linear de v3, V2, +.» Vn- 


Prova: De fato v E V, V = av, +. tunva pois [vi =. Yn] = V, e co- 
mo, (vi, ..., Yn) é LI, OS ay, .... an são univocamente determinados. (Verifique!) 
Estamos supondo aqui que foi fixada uma ordem para os elementos da base. 
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4.6.11 Definição: Sejam 8 = (v,,..., vn) base de Ve vE V onde 
v=a;v, +... + nVn. Chamamos estes números a,, ..., a, de coordenadas de v 
em relação à base 8 e denotamos por 


E 


lv; = 


An 


Exemplo: V = R? 


= {(1, 0), (0, 1)} 
(4, 3) = 4(1,0) + 3(0, 1). 


Portanto [(4, 3)Jg E N 


Se B' = (1, 1), (0, 1)), então (4, 3) = x(1, 1) + y(0, 1), resultando x = 4 e 
y=-. 


Então (4, 3) = 4(1, 1) - 1(0, 1), donde [(4, 3)lg' = É 


Observação: É importante notar que a ordem dos elementos de uma base tam- 
bém influi na matriz das coordenadas de um vetor em relação a esta base. Por 
exemplo, se tivermos: 


Bi = {1, 0), (0, 1)} e Ba = {(0, 1), (, 0)), 


K4, 3), [5] mas [(4, TEH 


Em virtude disto, doravante, ao considerarmos uma base 8 = (vs, V2, -.., Ya), 
estaremos sempre subentendendo que a base seja ordenada, isto é, que os veto- 
tes estão ordenados na ordem em que aparecem. Outras situações onde a ordem 
dos vetores é de suma importância são apresentados em 4.7 e nos Capítulos 


Se 0. 


então 


4.6,12 Exemplo 


Considere: 


y= i, y,z);x+y-z=0} 
W= {(x,y,z);x =y} 
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Determine V + W. 


Observe que 


V = [(1, 0, 1) , (0, 1, 1)] 
w = [(1, 1, 0) , (0, 0, D] 


Então 
v+ W= [(1, 0, 1) , (0, 1, 1) , (1, 1, 0) , (0, 0, 1)} 
(Veja 4.6.9.) 


Como, dado (x, y, z) € R? podemos escrever 


(x, y, z) = a(1, 0, 1) + (O, 1, 1) + 7C, 1, 0) + (0, 0, 1) 


Com 
a=x Observe que a solução deste 
p=y sistema não é única uma 
y=0 vez que 4 vetores no Rº é 
8=z-x-y necessariamente LD. 


Portanto V + W = R°. 

Usando 4.6.9, 

dim R? = dim V + dim W - dim (V O W} 
temos que dim (V N W) = 1 

Vamos determinar V N W. 


VNnW = {œ,y,z ;x+y-z=0e x=y) 
{@, y, z);x =y = 2/2) 
iC, 1, 1/2} 


(Confira com o Exercício 25.) 


ji 


Para concluir esta secção gostaríamos de recomendar mais fortemente 
alguns exercícios. Os espaços vetoriais mais usados na prática são os R” e seus 
subespaços e, por isso, é bom saber obter suas bases de modo rápido: Um pro- 
cesso para tal fim é delineado nos Exercícios 17 e 18 da secção 4.8. 

Volte ao Exemplo 4 da seção 4.3.2. Se quisermos explicitar o espaço-so- 
lução, teremos que resolver o sistema. Fazendo isto, verificamos que o espaço- 
-solução é o espaço gerado por 
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1 
~ 


e, portanto, é um subespaço de dimensão 1. Observe ainda que o grau de li- 
berdade do sistema é 1. Faça o Exercício 21b e c da secção 4.8. 


4.7 MUDANÇA DE BASE 


Você já deve ter visto uma situação em que a resolução de um problema de 
Física (de cinemática ou estática, por exemplo) torna-se muito mais simples se 
for escolhido um referencial conveniente para descrever o movimento. Por exem- 
plo, num problema em que um corpo se move no plano xy, cuja trajetória é uma 
elipse de equação x? + xy + y? -3 = 0 (veja a Figura 4.7.1), a descrição do 
movimento torna-se muito simplificada se ao invés de trabalharmos com os 
eixos x e y (isto é, o referencial determinado pela base formada por fe D, 
utilizamos um referencial que se apóia nos eixos principais da elipse. 


Yi x1 


Figura 4.7.1 
Neste novo referencial, a equação da trajetória será mais simples: 
2 2 
3x] + 271 =6 
(Depois você verá, no Capítulo 11, como foi encontrada esta equação.) 
Numa situação desse tipo, temos duas questões a resolver: 


1) Como escolher o novo referencial? 
2) Uma vez escolhido, qual a relação entre as coordenadas de um ponto 
no antigo referencial e suas coordenadas no novo? 
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A primeira questão é mais delicada e será estudada no Capítulo 11. Agora, 
veremos como solucionar a segunda. Passando a um contexto mais amplo, esta- 
mos interessados na seguinte situação. 


4.7.1 Sejam B = (u,, .., Un} e B' = (ws, ..., Wn} duas bases ordenadas 
de um mesmo espaço vetorial V. Dado um vetor v € V, podemos escrevê-lo 
como: 


e (8) vV=XU +. +t Xyün 
V= Yw, t.. t YnWn 


Como podemos relacionar as coordenadas de v em relação à base 8, 
Xi 
lvlg = 
Xn 


com as coordenadas do mesmo vetor v em relação à base B, 


Yı 
lvk' = 
Yn 
Já que (uy, ..., un) é base de V, podemos escrever os vetores w; como combi- 


nação linear dos u;, isto é, 


Wi = GU t da +... + Am Un 
W, = GU, + anih +... + Amo Un 


(88) 


Wa = dint; + dant +. t ännUn 
Substituindo em (§) temos: 


Y= yW, t.. t YnWn 
= yant +... + amun) +... t Ynllinl +t. + annn) 
= (aY, +. tanto. + (amy + t annyYn)Un 


Mas v = X1U; + ... + Xyly, € como as coordenadas em relação a uma base são 
únicas, temos: 
X =) t Goya + t ainYn 


Xn = mY tg) + t annYn 
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Xi an = Gn ||Yi 
Xn Um Zan Yn 
Isto é, denotando 
“Um 312 is Gin 
n Qu e Gan 


Gm Um -© Im 


temos 
Ivl = gi É Lvlg! 


A matriz |Z l é chamada matriz de mudança da base ß' para a base ß. 


t 


[d 
Compare uÉ com (88) e observe que esta matriz é obtida, colocando as 
coordenadas em relação a 8 de w; na i-ésima coluna. Note que uma vez obtida 
H f podemos encontrar as coordenadas de qualquer vetor v em relação à base f, 


multiplicando a matriz pelas coordenadas de v na base B' (supostamente conhe- 


cidas). 
O exemplo a seguir esclarece melhor o papel da matriz de mudança de 


base. 
Exemplo: Sejam 8 = ((2, -1), (3, 9) e 8 = {(1, 0), (0, 1)) bases 
de R?, Procuremos, inicialmente, L A 
Wi = (1, 0) = an(2, 1) + an(3, 4) 
donde (1, 0) = (241 + 341,4 + 4421). 
sto implica que &,, = Ti e da = TA 
wa = (0, 1) = an (2,-1) + an (3,4) 


5 
Resolvendo, lj = Ir e€ dy = TE” 
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Portanto, 


mj l 
w 


4 
uÉ = au anj |n 1 
B la ün Aa 2a 
11 


11 


Podemos usar esta matriz para encontrar, por exemplo, [vlg para v = (5, -8). 


[(5, -8)] 


u 


uý ICS, -S)Jp' 


L] 
ej U 


z» HI 
do 


Isto é, 
(5, -8) = 4(2, -1) - 1(3, 4) 


É claro que se o nosso problema fosse só encontrar as coordenadas de (5, -8), 
em relação à base 8, poderíamos simplesmente resolver o sistema 


(5, -8) = a(2, -1) + b(3, 4). 


O cálculo feito através da matriz de mudança de base é operacionalmente van- 
tajoso quando trabalharmos com mais vetores, pois neste caso não teremos que 
resolver um sistema de equações para cada vetor. 


4.7.2 A Inversa da Matriz de Mudança de Base: Se em 4.7.1 começarmos 
escrevendo os u; em função dos w;, chegaremos à relação: 


Ivl = fy [vig 
Um fato importante é que as matrizes uÉ e uÉ são inversíveis e 
t A = 
UÉ = U% 
Veja o Exercício 34 da secção 4.8. 


4.7.3 Exemplos 


Exemplo 1: No exemplo anterior podemos obter [Z f a partir de Uh. 
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Note que Ua é fácil de ser calculada, pois 8” é a base canônica. 
(2, -1) = 2(1,0) - 1(0, 1) 
(3, 4) = 3(1, 0) + 4(0, 1) 

donde 


T 
% 
n 

I 
ma O 
Aw 


| 
ts 


4 
r -i 11 
emou =| 2 a-y 


Exemplo 2: Consideremos em R? a base ĝ = {e;,, e2} e a base 
g' = (f,, f2}, obtida da base canônica $ pela rotação de um ângulo 0. Dado 
um vetor v € R? de coordenadas 
=/% 
lvi = É 


em relação à base É, quais são as coordenadas 


RASA 


em relação à base B'? Temos então 


fo =l 


tre 
pa 
to 
[a 


Figura 4.7.2 


v= Xe + X26 
= yfi + 
e queremos calcular 


LvJo' = uiy [vls 


ou seja, temos que achar a matriz uý. Para isto, devemos escrever e; € e, em 


função de f, e f,. Veja as Figuras 473 e 4.74. 
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e; = cosgf, - sen df, 


e, = sen öf; + cos Of, 


Portanto, Ua = 


cos sent Figura 4.7.3 
-senf cosê 


gonde | 7 a h SO e X 
»» -senô cos8| | x, 


Figura 4.7.4 


ou seja, Yı =X, cost + x, senl 
Yı =-X; sen + x, cos? 


Como subexemplo, quando 8 = A para v = (-2, 3), isto é 


v=-2e, + 3e,, temos [vlg = kl 


Figura 4.7.5 


e queremos determinar as coordenadas de v na base 8º = (f,, fa}. 
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Como vimos, Lvlo; = É | 
2 


T 
onde y; = xı cos + x; senf = -2 cos — + 3 sen = 


3 3 
Y2 = -x; sen + x, cos =2sn + 3cosT 


-2 + 3V3 


2 
donde [viy =| 34943 


2 


-2 + 3V3 3+2V3 
ou seja, y= | jit a yi 


4.8 EXERCICIOS 


cs 


un 


. a) Seja V o espaço vetorial R”, definido no Exemplo 2 de 4.2.2. Qual é o 


vetor nulo de V e o que é -(X1, X2, -= Xn)? b) Seja W = M(2, 2) (veja 
4.2.2 Exemplo 3 i)) descreva o vetor nulo e vetor oposto. 


. Mostre que os seguintes subconjuntos de Rº são subespaços 


a) W = {x,y,z )ERtixtyp=0e2-1=0) 
b) U ={(x, y, z NE Ri x+y-t=0ez=0} 


. Responda se os subconjuntos abaixo são subespaços de M (2, 2). Em caso 


afirmativo exiba geradores 


av à | com abade Reb=c | 
cd 

a b = 
ow: 4 com a bode Reb=c+ | 


. Considere dois vetores (a, b) e (c, d) no plano. Se ad - bc = 0, mostre que 


eles são LD. Se ad - bc + 0, mostre que eles são LI. 


. Verifique se os conjuntos abaixo são espaço vetoriais reais, com as opera- 


ções usuais. No caso afirmativo, exiba uma base e dê a dimensão. 


a) Matrizes diagonais n X 1 
b) Matrizes escalares n X n 
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ofl! z ’liaser} 


d) V = {(a, a, ..., a) E R”: a E R} 
e) {(1, a, b):a, b E R} 


f A reta (x, x + 3): x € R} 
g) (a, 2a, 3a): a E R} 


6. Considere o subespaço de Rº 
S = IO, l, -2, 4), (l, i; -1, 2), (l, 4, -4, 8) 


a) O vetor 5. 1, -1, 2) pertence a $? 
b) O vetor (0, O, 1, 1) pertence a $? 


7. Seja W o subespaço de M(2, 2) definido por 


22 0+2b|, 
vl iasen) 
a) É E em b) É | EW? 


8. Seja W o subespaço de M(3, 2) gerado por 


0 0 O 1l 01 0 2 
1 1 O -Ilel0O O|.Ovetor|3 4j pertence a W? 
O Oj, |1 0 0 0 5 0 


9. Mostre que 


ı ollo al lo of jo o 
o ojlo oj, jı ol, lo À 
é base de M(2, 2). 


10. Escreva uma base para o espaço vetorial das matrizes n X n. Qual a dimen- 
são deste espaço? 


11. Quais são as coordenadas de x = (1, 0, 0) em relação à base 8 = {(1, 1, 1), 
(-1, 1, 0), (1, 0, -1)}? 


15. 


16. 


17. 
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. Qual seria uma base “natural” para Py? (Veja o Exemplo 4 de 4.2.2). Dê a di- 


mensão deste espaço vetorial. 


. Mostre que os polinômios 1 - 4), (1-4), 1 -te | geram o espaço dos 


polinômios de grau < 3. 


- Considere [-a, a] um intervalo simétrico e C! [-a, a} o conjunto das funções 


reais definidas no intervalo [-a, a] que possuem derivadas contínuas no 
intervalo. Sejam ainda os subconjuntos V, = (fx) € C! [-a, a} Re) = Kx), 
vx Ela al} e Vi = (fŒ) EC l-a, a] | -x)= - Ax), Yx E [-a, al}. 

a) Mostre que C’ [-a, a] é um espaço vetorial real. 

b) Mostre que V, e V, são subespaços de C! [-a, a]. 

c) Mostre que VLOV = C’ [-a, al. 


Seja V o espaço das matrizes 2 X 2 sobre R, e seja W o subespaço gerado 
por 


bs Aia 


Encontre uma base, e a dimensão de W. 


Seja P o conjunto de todos os polinômios (de qualquer grau) com coeficien- 


tes reais. Existe uma base finita para este espaço? Encontre uma “base” para 
P e justifique então por que P é conhecido como um espaço de dimensão 
infinita. 


a) Dada uma matriz A de ordem m X n, você pode considerar as m linhas 
como vetores do R” e o subespaço V, de R”, gerado por estes m vetores. 
Da mesma forma para a matriz B, linha reduzida à forma escada de A, 
podemos considerar o subespaço W gerado pelos m vetores, dados por 
suas linhas. Observando que cada linha de B é obtida por combinação 
linear das linhas de A e vice-versa (basta reverter as operações com as linhas), 
justifique que V = W. 

b) Mostre, ainda, que os vetores dados pelas linhas não nulas de uma matriz- 
-linha reduzida à forma escada são LI. 


. Considere o subespaço de Rº gerado pelos vetores v; = (1, -1, O, 0), 


va = (0, 0, 1, 1), v3 = (-2, 2, 1, 1) e »a = (1, 0, 0, 0). 

a) O vetor (2, -3, 2, 2) E Ir. V2, Y3, Va ]? Justifique. 

b) Exiba uma base para [v;, V2, V3» Va ]. Qual é a dimensão? 
c) Iva, va; Va; va] = Rĉ? Por quê? 
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19. Considere o subespaço de R? gerado pelos vetores v; = (1, 1, 0), 
va = (0, -1, 1) e Va = (1, l, 1). (vi, V2, va] = R? ? Por quê? 


5 tais que a 
d q 
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26. Sejam W (E 
e W, i À tais que a=c¢c e b 


subespaços de M (2, 2) 


a) Determine W, N W3 e exiba uma base. 
b) Determine W, + Wz. E soma direta? W, + Wa = M (2, 2)? 


20. Use o exercício 17 para exibir uma base para o subespaço S, definido no 
Exercício 6. Qual é a dimensão de $? 


u 
[an 
— 


21. Considere o sistema linear 


2x, + 4x, - 6x3 =q 
(8)4 x- x) + dx =b 
6x» a 14x3 c 


27. a) Dado o subespaço V, = {(x, y, z) E R? | x + 2y +z = 0} ache um 
subespaço V, tal que R? = V, ®© V3. 
b) Dê exemplos de dois subespaços de dimensão dois de R? tais que 
Vi +t Va = Rê. A soma é direta? 


Seja W = (x, X2} x3) E R?: (xy, X2, X3) é solução de (§)}. Isto é, W é o 

conjunto-solução do sistema. 

u) Que condições devemos impor a a, b e c para que W seja subespaço ve- 
torial de Rº? 

b) Nas condições determinadas em a) encontre uma base para W. 

c) Que relação existe entre a dimensão de W e o grau de liberdade do siste- 
ma? Seria este resultado válido para quaisquer sistemas homogêneos? 


28. Ilustre com um exemplo a proposição: “Se U e W são subespaços de um 
espaço vetorial V que tem dimensão finita, então: 


dim (U + W) = dim U + dim W - dim (U N W).” 


29. Sejam 8 = {(1, 0), (0, D}, 81 = {-1, 1), (1, D}, 82 = (V3, 1), (V3, =D) 


22. Seja U o subespaço de R?, gerado por (1, 0, 0) e W o subespaço de Rº, ge- 
e Bs = {(2, 0), (0, 2)} bases ordenadas de R?. 


rado por (1, 1, 0) e (0, 1, 1). Mostre que R? = UV. 
a) Ache as matrizes de mudaça de base: 


23 Demonstre o teorema 4.3.5, isto é, mostre que, dados u = w; + w, E » LÊ! iD U üd U B iv uÉ 
E Wi tW, ev=w, +w, E W, + W, (onde w, w} E Wi e w2, w3 E W3), D Uh ) UÉ, ) b, ) Bs 
Mo WENE WEE M CREE Wet Py para IEEE R, b) Quais são as coordenadas do vetor v = (3, -2) em relação à base: 
i) B ii) Bı üi) Bo iv) Bs 


24. Mostre que, se V = WOW, e a = {v1, .., Vg} é a base de W, 
B= {wi, . wp} é a base de W, então y = (Vis Yk, Wis os W} É 
base de F. 
Mostre com um exemplo que o resultado não continua verdadeiro se a soma 
de subespaços não for uma soma direta. 


c) As coordenadas de um vetor v em relação à base 8, são dadas por 


vh, = H 


Quais são as coordenadas de v em relação à base: 
25. Sejam W= {(x, y, z, DN|ER|x+ty=0ez-t=0} e i) B i) B iii) Ba 
W= {6 y, z DE Rİ|x-y-z+t=0} 


subespaços de Rº. 


30. Se , l 

mE =[|0 11 
a) Determine W, N W2. bg 
b) Exiba uma base para W N W3. 

c) Determine Wi + W3. 

d) W, + W2 é soma direta? Justifique. 
e) W, +t W= R’? 


ache 
S -1 


b) [vy onde Iva =] 2 
3 


I! 
N 


a) [vl onde [viy 
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31. Se ' é obtida de f, a base canônica de R?, pela rotação por um ângulo 


b) uÉ, 


32. Sejam &, = {(1, 0), (0, 3}, Ba = {-1, 0), (1, 1)} e Ba = {-1, -1), (0, -D} 


três bases ordenadas de Rê. 
a) Ache 
o Uh i) IÉ? io uÉ? b) rf? Up 


b) Se for possível, dê uma relação entre estas matrizes de mudança de base. 


33. Seja V o espaço vetorial de matrizes 2 X 2 triangulares superiores. Sejam 


E 9 183) 
E 


duas bases de V. Ache uý! 


e Bi 


34. Volte a 4.7.2 e mostre efetivamente que UÉ je uh, 


35. Se a é base de um espaço vetorial, qual é a matriz de mudança de base 


Lg? 
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4.9 RESPOSTAS 


4.9.1 Respostas de 4.8 


1. 0 = (0, O, ..., 0) e (x5,..., xn) = Xis e -Xn) 
2. a) Façamos os testes, lembrando-nos que o que define W são as condições 
dentro dos parênteses 
i) Sejam vı = (X1, Yi, Zi, t1) E W e v3 = (x3, Y2, Z3, h) EW, 
Então v; + v, está ainda em W? Vejamos: 
Vi + y2 = (x1 + X2, Yi t Y2, Zi t Z2, fi +t). 
Testemos se este novo vetor satisfaz as condições que definem W: 
Œi t x2)+ Oi + y2) = 1 tyi) t+ ya)=0+0=0 
(Zi +z2)- (fi + t2) = (z1 -t4)t2-t,)=0+0=0 
pois v; e v, estão em W e satisfazem as condições implicando que 
vı + v, também o faça. Portanto v; + v, E W, 
ü) Seja v = (x, y,z,t) EW eE R. Então à- v = (Àx, Ay, Az, AS). 
Testemos as condições: 
A tip=A(xty)=A-0=0 
AZ -M=A(Z-t)=A-.0=0 
Assim Av E W. Portanto W é subespaço. 


b) O mecanismo é análogo. 


3. a) Façamos os testes para V. 


Sejam | “1 Di le[%2 Dr | vetoresem Ve RE R Então 
Ci dı C2 da 


ay bil,|ãa bil lata bitb o 
Cc di C2 dz E cit cz dı + dz 


vale que bı + ba =c, +c, pois bi =C, e b=c 


a b Ma Ab 
afi Ai o |e vale Ab, = àc; pois b; =c}. 


Portanto W é subespaço de M (2, 2). 

b) Façamos os testes para W. Supondo os vetores acima em W ao fazermos 
a soma teremos que testar se bı + b2 = C, +c, + 1, que é a propriedade 
que caracteriza W. Porém bı = c, + l e b3 = c, + 1e, portanto, 
bi + ba=c1+1+ce+ l =c: tc +2. Assim W não é subespaço. 
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Poderíamos ter a resposta mais rapidamente se observássemos aele a 


não está em W pois não satisfaz a propriedade que o caracteriza. 
iá ã i ito em 
Vamos exibir geradores apenas para V já que não existe este e a 
i e 
Wiínão é subespaço). Observe que a forma mais geral de um vetor 


b 1 0 O 1 
[5 A que pode ser escrita como Ê à] =4 b o] tp l oj 
1 0 0 1 na 0 0 pa 
d E . Além disso v; = h E] » Pa — f J e Va S p 1 Estao, 


em V. Portanto, todo vetor de V é combinação linear de vi, V2 € Y3, OU 
seja, Y1, Va, V3 SÃO OS geradores procurados V = [vi va val 


E Sou Q o_ 0 
SI KS ~~o. -n 
5. a) Sim; [UM ; “O. gls e. ; 


q 0 ~ 
KO 
b) Sim; ea | 
0 AH 
o fm To 4 
e) sm; [i a É dh E 


Sim; {(1, ..., D} 1 f) Não. 
p Não. g) Sim. ((1, 2,3); 1. 
7. a) Pertence b) Não pertence 


e Je Jo ee ode] 


e os vetores são LI. 


11. xl = 


wj= vje w= 
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13. Seja at? + bt? + cet+d =al -+60 -P +t -A+tE 
Então -a =a, B =b, -P -y=cat+tfßt+tytő=d 
Portanto a = a, P = b, y = -2b -c,5=atb+c+d. 


14. c) Note que toda função f(x) E C! [-a, a] pode ser escrita como 


fo) = Fix) + Fo(x) com F) - fo) + o) e Fi) - MO Mem), 


Além disso Fi(-x) = Fi(x) e Fa(-x) = - Fa(x) e portanto Fi(x) E V, e 
PO) E Vo. Assim V, + V;=C![-a, al. Ainda que gx) E V, O Vz 
devemos ter ao mesmo tempo g(-x) = g(x) = -g(x) donde g(x) = O para 
todo x. Portanto V, N V, = {0} e CŒ [-a, a] = VON. 


16. Não; MLP, ts 


18. a) Temos que saber se existem x, y, z e t E R tais que (2, -3, 2, 2) = 


= x(1,-1,0,0)+ (0,0, 1, 1) +2z(-2,2,1,1)++(1,0,0,0), ou seja, temos 
que saber se o sistema 


x -Q2+t= 2 
-x +2z =-3 
y +z = 2 
p+z = 2 


é possível ou impossível. Utilizando as técnicas (operações com linhas) 
do Capítulo 2 obtemos que o sistema não somente é possível como 
admite infinitas soluções. Portanto (2, -3, 2, 2) pertence a 

[vis Vo, Va, Val. 


b) Já pelo item (a) poderíamos afirmar que {v;1, v2, V3, V4} não formam 


uma base pois uma das propriedades de uma base é o fato de qualquer 
vetor poder ser escrito de modo único como combinação linear dos 
vetores da base e, pelo item (a), como o sistema é indeterminado, 
existem infinitas maneiras de se fazer isto. Não utilizaremos isto, 
entretanto, no raciocínio que se segue. Coloquemos os vetores um sob o 
outro obtendo a matriz 


1 -1 0 0 
0O 0 11 
-2 2 1 1 
1 0 0 0 


Operações com as linhas desta matriz são equivalentes no espaço vetorial 
a fazer combinações lineares e portanto as novas linhas serão ainda 
vetores do subespaço. Além disso, sendo as operações com as linhas 
reversíveis, as novas linhas gerarão os mesmos vetores que as linhas  giptioteca di 
Ciência & Teci 
LLECO, 
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21. 
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originais. Assim, ao operarmos com as linhas da matriz para consegui-la 
na forma escada não estaremos alterando o subespaço e, na forma escada, 
as novas linhas não nulas representarão vetores linearmente independentes 
e que geram o subespaço, ou seja, uma base (veja o exercício 17). No 
nosso caso obtemos 


14 0 0|[1 0000 
o o 1 1|]0 100 
-2 dot) (0 0 1 1 
ı 0 0 o0oj|0 000 


Pelo raciocínio anterior, sendo w; = (1, 0, 0, 0), wz = (0, 1, 0, 0) e 

wa = (0,0, 1, 1), [vi, vo, Y3, v4] = wi, wa, wa] € {w1, Wa wa} éa 

base procurada. A dimensão, sendo o número de vetores da base, é 3. 
c) Ivi, Va, V3, va] não é igual a Rº pois dim [v;, va, »3, val=3e 

dim Rº = 4. 


((1,0,0,0),(0,1,-1,2);2 


a)ja=b=c=0. 

b) Resolva o sistema operando com as linhas como no Capítulo 2, Verifique 
o grau de liberdade e quais são as variáveis livres. Atribua valor 1 para 
uma delas e zero para as dutras e vá repetindo o processo para obter as 
soluções básicas (veja 2.5.7). Cada solução básica fornecerá um vetor da 
base de W (por quê? ). 

c) A dimensão de W é exatamente o grau de liberdade pois cada grau 
determina uma solução básica do sistema. O resultado é válido para 
qualquer sistema homogêneo. 


22. dim[(1, 0, 0)] = 1, e diml(t, 1,0), (0,1, D] = 2. Os três vetores são LI 


24. 


e portanto geram o R°. Como dim R? = 3, pela proposição 4.6.9 
dim {(1, 0, 0) NV, 1,0), (0, 1, 1)]} = 0. Então a soma é direta. 


Sugestão: Suponha que y não seja base de V. Então OU Vi, ..., Vk, Wi, -.., W2 
não geram V ou não são LI. As duas situações resultam numa contradição. 
Exemplo: Sejam W, o plano xy e W, o plano xz em Rº. A soma não é di- 
reta. Uma base de W, e (1, 0, 0), (1, 1, 0)) e uma de W, é ((1, O, 1), 
(0, 0, 1). Mas {(1, 0, 0), (1, 1, 0), (1, 0, 1), (0, 0, 1)) não é base de Rº. 


25. Inicie achando os geradores de W, e Wz, observando que eles são dados 


por sistemas lineares e portanto devemos procurar as soluções fundamentais 
para tais sistemas (veja o exercício 21 e sua resposta). Para W, teremos 
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x +y =0 
z-t=0 


Portanto x = -y ez =te teremos dois graus de liberdade fazendo y = i e 
t = 0 e depois y = 0 eż = 1, teremos os vetores wj = (-1, 1,0, Oje 
w2 = (0, O, 1, 1) que são LI (verifique). Assim Wi = [w], wa]. Para Wz 
teremos: x - y - z +t = 0 que fornece x =y +z - t com três graus de 
liberdade. Fazendo y = ł,z = 0e ¢ = 0, depoisy=0,z=1et=0e 
depois y = 0, z =0e¢ = 1 teremos w3 = (1, 1, O, 0), wa = (1, 0, 1, 0) 
e ws = (-1, 0, O, 1) que são LI (verifique). Portanto W, = [w;, w W ] 
Por outro lado W, N W, = {(x, y, z, Nlx+y=0,z-t=0e i 
x-y-2z+t= 0}. Para achar W, N W, resolvemos o sistema 


xty =0 
z-t=0 


Xx-y-z+t=0 
Operando com as linhas (como no Capítulo 2), obtemos 


x =0 
y =0 
z-t=0 


Portanto um grau de liberdade (na variável t). Fazendo t = 1, teremos a 
solução x = 0, y =0,z=}et=}Ì, ou seja, o vetor v = (0, 0, ł, 1). 
Portanto 

a) Wi N W2= [(0, 0, 1, 1)]. 

b) Uma base para W, N W;é {(0,0, 1, 1)} (unidimensional). 

c) Wi + W2= [(-1, 1, 0, 0), (0, 0, 1, 1), (1, 1, 0, 0), (1,0, 1, 0), (-1, 0, 0, 1)} 

d) W, + Wz não é soma direta pois W, N W + {0} PRE 

e) Para responder se W, + W=Rº vamos exibir uma base de W, + W. 
Para isto, considere seus geradores e opere com eles como no exercício 18 
para obter novos geradores linearmente independentes 


110 0|[1 000 
o 0 11]/0100 
ı ı 0 ojf~lo 0 ı o 
ı o 10]||0001 

10 0 1 00 0 0 


Portanto, W: + W: = Ka, 0, 0, 0), (0, l, 0, 0), (0, 0, 1, 0), (0, 0, 0 1)] 
e dim (W, + W2} = 4 e portanto W, + W4 = R4. ' 


k 27. a) Vamos calcular, inicialmente, os geradores de V,. Observe que o sistema 


linear x + 2y +z = O tem dois graus de liberdade. Então x = -2y - z. 
Fazendo y = 1 e z = 0, obtemos a solução x = -2, y =1,z = 0, ou seja 
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o vetor v; = (-2, 1, 0). Por outro lado, fazendo y = O eza l, obtemos 
o vetor v, = (-1, 0, 1). Como toda solução do sistema é combinação 
linear dessas soluções fundamentais, todo vetor de V, é ae 
linear de v; e vz. Portanto V, = vi, va] (veja exercícios 21 e as 
Observe ainda que como », € vz são LI, V, é de Ca dois. 

ora que se temos subespaços W, = wi, W2, o Wkle 
W = ves .. We] então W, + Wa, sendo formado pelos vetores por 
são obtidos por somas de vetores de W, e vetores de Wz, pode - a 
Wi + W = [Wi Wa, o Wks Wkers « We]. Portanto para obter 2 i 
Ke ViOV, = R?, V, deve ser gerado por apenas um terceiro vetor V3 
LI com », e v, (para completar a dimensão de R o: E 

lo, va = {0, 0, 

V, N V, = {0}. Podemos tomar, por exemplo, v3 De 
y, = LO, 0, DI = {(x, y, Dix=0,p=0€e7€ R}. A disposição 
geométrica deste exercício é 


Procure outras soluções. 

b) Um exemplo seria V, = [(1, 0, 0), (0, 1, 0)] e V3 = [(0, 1, 0), (0,0, 1)]. 
Neste caso a soma não seria direta pois V; O V, = I(0, 1, 0)]. Note 
ainda que V, e V, poderiam ser escritos como V; = ((x, »2)|z=0, 
x e y reais quaisquer) e V, = ((x, y, Z7)lx=0epez reais quaisquer}. 
Procure outros exemplos mas note que em nenhum exemplo a soma 
pode ser direta porque senão a dimensão de R? seria 4 (veja o exercício 29). 


35. A matriz identidade. 
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TRANSFORMAÇÕES 
LINEARES 


5.1 INTRODUÇÃO 


vem o tipo mais simples de dependência entre variáveis. 
ntados por tais funções. Por exemplo: Se 

dos 0,2 litros de óleo, de uma produção 
os de óleo. Escrevendo na forma de 


Funções lineares descre 
Muitos problemas podem ser represe 
de um quilograma de soja, são extraí 
de x kg de soja, seriam extraídos 0,2x litr 
função, teremos 


Q(s) = 0,25, 


onde Q = quantidade em litros de óleo de soja e 
Estes dados podem ser colocados graficamente: 


o = 0,25 


Figura 5.1.1 


s = quantidade em kg de soja. 
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Vamos analisar neste exemplo simples duas características importantes: 


1) Para calcular a produção de óleo fornecida por (sı + s,) kg de soja, pode- 
mos tanto multiplicar (s, + s,) pelo fator de rendimento 0,2, como calcular 
as produções de óleo de cada uma das quantidades s} e s, e somá-las, isto 
é, O(s, + s2) = 0,25, + s2) = 0,281 + 0,25, = Q(s,) + Q(5,). 


2) Se a quantidade de soja for multiplicada por um fator k, a produção de 
óleo será multiplicada por este mesmo fator, isto é, Q(ks) = 0,2(ks) = 
= k(0,25) = k - O(s). 


Estas duas propriedades, que neste caso são óbvias, servirão para caracte- 
rizar O que denominaremos “transformação linear”. Vejamos ainda um segundo 
exemplo de uma situação envolvendo mais fatores e que apresenta o mesmo 
comportamento. 

A quantidade em litros de óleo extraída por quilograma de cereal segundo 
um determinado processo pode ser descrita pela tabela, 


Soja Milho Algodão Amendoim 
Oleo (£) 0,2 0,06 0,13 0,32 
A quantidade total de óleo produzido por x kg de soja, y kg de milho, 
zkg de algodão e wkg de amendoim é dada por Q = 0,2x + 0,06) + 0,137 + 


0,32w. Observe que a quantidade de óleo pode ser dada pela multiplicação da 
“matriz rendimento” pelo vetor quantidade. 


Q =10,2 006 013 0,32] = 0,2x + 0,06) + 0,137 + 0,32w 


Ent x 


Formalmente, estamos trabalhando com a função Q:A C Rº>R 


—Slo2 0,06 013 0,32] 


Ink 
Ent x 
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que, como no exemplo anterior, goza das propriedades: 


1) X1 X2 Xı X2 
Yı Yi Ya Ya 
+ = + 
Q Zi Zz Q Zi Q Z3 
Wi Wa wi Wa 
2) x x 
y = y 
Q |k E =k.Q f 
w w 


Você deve verificar e interpretar estas propriedades. 

Pensemos agora em termos de espaços vetoriais. Uma função entre espa- 
ços vetoriais, satisfazendo as condições 1 e 2, é a “mais natural possível”, pois 
respeita toda a “estrutura” de espaço vetorial. 

5.1.1 Definição: Sejam V e W dois espaços vetoriais. Uma transformação 
linear (aplicação linear) é uma função de Vem W,F:V> W, que satisfaz as 
seguintes condições: 

i) Quaisquer que sejam u e v em V, 
F(u + v) = F(u) + F(v) 
é) Quaisquer que sejam k E Re v EF, 
F(kv) = kF(v) 


5.1.2 Exemplos 


Exemplo 1: As funções apresentadas ao introduzirmos este capítulo, uma 


vez que as variáveis são positivas, são restrições das seguintes aplicações lineares: 


) V=W=ReQ:R>R 
xe 0,2x 


i) V=Rº,W=Re Q:R'>R 


» [02 0,06 0,13 0,32] 


Ent x 
Ent NX 


Exemplo 2: 


V= R e wW = R 
FIR>R definida por u»au ou F(u) = au 
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C = = 

id E eia pe o) = au + av = F(u) + F(v), F satisfaz a primeira 

0 16 00 u) = a(ku) = k(au) = kF(u), F satisfaz a segunda condi- 
ção. Logo F é uma transformação linear. 


E a o Piy Eee linear de R em R só pode ser deste tipo. 
E ps os ) e como F é uma transformação linear e x um esca- 
f )} =x F(1). Chamando F(1) = a, temos F(x) = ax 
o nome transformação linear certamente foi inspirado neste caso, V = 
=W = R, pois o gráfico de F(x) = ax é uma reta que passa pela orige, 


Exemplo 3: 
FR>R 
u>u? ou F(u) =v. 
oia já E concluir que F não é linear pelo que foi mostrado no exemplo 
anterior. Se você desconhecesse o resultado dado, teria ão li 
. À E i 
ridade de F diretamente: AE E RR 
F(u + v) = (u + v? = u? + 2uv + v? 
e F(u) + F(v) = u? + v? 


Portanto, 
F(u+ v) + F(u) + F(v) 


Exemplo 4: 
V=Rº e W=R’ 
F:R? > R? 
(x, y} (2x, 0, x +y) ou F(x, y) = (2x, 0, x + y). 
Por exemplo, F(1, 2) = (2, 0, 3) E Rº. 
Dados u, v E R?, sejam u = (X, yı) € v= (x2, Y2) onde x; y; E R. Temos: 


F(u + v) = F((xi, y1) + (Xz y2)) = F(x; + x2, yi + y2) 
= (Mx + x2), 0, (xı + x2) +t W1 + y2) 
= (2x1, 0, xı + y1) + (2x2, 0, x2 + y3) 
= F(u) + F(v) 


Logo, a primeira condição é satisfeita. Mais ainda, 
F(ku) = F(k(x, y)) = F(kx, ky) 

= (2kx, 0, kx + ky) 
= k(2x, 0, x + y)= kF(u) 


e a segunda condição é satisfeita. Então F é uma transformação linear 
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Observação: Decorre da definição que uma transformação linear T:V > W leva o 
vetor nulo de V no vetor nulo de W, isto é, se 0 E V, T(0) = 0 € W. Isto nos 
ajuda a detectar transformações não lineares. Se T(0) £ 0, T não é linear (veja 
o Exercício 1 da secção 5.6). Mas cuidado T(0) = O não é suficiente para que 

T seja linear (veja o Exemplo 3 acima). Assim, por exemplo, 7:R° >R? onde 
T(x, y, 2) =(x+1,),2) não é linear. 


Exemplo 5: 
Sejam V = W = P (polinômios de grau < n) e D:Py > Pp, à aplicação derivada 
fef 
que a cada polinômio f associa sua derivada, a qual também é um polinômio 
(com 1 grau a menos). Como para quaisquer funções deriváveis, 
DG + 8) = DP) + DE) 
e D(kf) = kD), 


D é uma aplicação linear. 


Exemplo 6: A aplicação nula 

FV>V 
ur» O é linear. Seria conveniente que você demonstrasse esta afirmação, pois 
assim você poderia compreender melhor a definição 5.1.1. 

O próximo exemplo é muito importante. O que mostra este exemplo é 
que a toda matriz m X n está associada uma transformação linear de R” em 
R”. Em outras palavras, podemos dizer que uma matriz produz uma transfor- 
mação linear. A implicação inversa também é verdadeira, isto é, uma transfor- 
mação linear de R” em R” pode ser representada por uma matriz m X n. Isto 
será mostrado posteriormente. 


Exemplo 7: 
V=R" e W= R” 
Seja A uma matriz m X n. Definimos 
La :R” > R” por 


ve AÅ ev 
X1 
onde v é tomado como vetor coluna, v = 
Xn 
X1 Yı 
La(vy) =A: =: 
Xn Ym 
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Das propriedades de operações de matrizes: 


ar +v) = A(u + v) = Au + Av = La(u) + L(Y) e La(ku) = A(ku) = 
= k(Au) = kLA(u), e portanto LA é uma transformação linear. 


2 0 
Como caso particular suponhamos que A = |0 O 
La 


LAR? >R? 
2 0 
o o 0/.[* E 
X2 e 2N Ra 0 
1 1l 2 
X + X 


Então La(x,, x2) = (2x1, 0, x, + x3). 
Surpresa! Esta é a aplicação linear do Exemplo 4. 


Seria interessante que você também notasse o relacionamento que existe 
entre o Exemplo 1, e o Exemplo 7. 


5.2 TRANSFORMAÇÕES DO PLANO NO PLANO 


Paai iremos apresentar uma visão geométrica das transformações lineares, dan- 
É d 

o alguns exemplos de transformações do plano ( R?) no plano. Você verá assim 

que, por exemplo uma expansão, uma rotação e certas deformações podem ser 

descritas por transformações lineares. 


5.2.1 Expansão (ou Contração) Uniforme: 
T:R? >R? a ER 
vea. y 
Por exemplo: T:R? > R? 
ve 2y, ou T(x, y) = Hx, y) 
Esta função leva cada vetor do plano num vetor de mesma direção e sentido 
de v, mas de módulo maior. 


Tiv) 
P T 


Figura 5.2.1 
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Observe que, escrevendo na forma de vetores-coluna, 5.2.4 Rotação de um Ângulo 0: (no sentido anti-horário) 


Je Bi ID) 


l à A 
Se tomássemos F:R? > R? tal que F(x, y) = 5 (x, y), F seria uma contração. 


5.2.2 Reflexão em Torno do Eixo-x: 
F: R? > R? 
(x, yje (x, -y) 


Figura 5.2.4 


x =rcos(a + 4) =r cosa cost -rsena sen ð 
Mas rcos0 = x e rsen = y. 
Então x' = x cos - y sen ð. 


Analogamente, y' = r sen (a + 0) = r(sena cos + cosa sen 0) = y cos8 + 
+ x sen 8. 


Assim Rg(x, y) = (x cos8 - y sen, ycosð + x sen) ou na forma coluna, 
x x cos - y sent cosô send x 
Fo = 
y y cos + xsenô sen 0 cos 8 y 


. T 
Consideremos o caso particular onde & = 2º Neste caso, cos = 0 e 
sn = l. 


ee BCE 


sw] sE: E 


5.2.3 Reflexão na Origem: 
T:R? > R? 
ve>-v, ou seja, T(x, y) = (x, -y) 


x ppe S 
Ttv) 


M Rgtv) 
Rg 
————» 
Figura 5.2.3 
Escrevendo na forma de vetores-coluna, temos 
x -xj _ |-l 0 x 
é RIU my tro y Figura 5.2.5 
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5.2.5 Cisalhamento horizontal: 
T(x, y) = (x + ay, y), a ER 
Por exemplo: T(x, y) = (x + 2y, y) 


piee iB] 


Tiv} 


Figura 5.2.6 


Como já ressaltamos, as transformações do plano no plano apresentadas 
através dos exemplos anteriores são lineares, pois são dadas por v» A - v onde 
A é uma matriz 2 X 2. A aplicação a seguir não é linear. 


5.2.6 Translação: 
T(x, y)=(x+a,y+b) 


mal] Ss 1 0O/|x 412 
Y 0 1 y b 
Esta é uma translação do plano segundo o vetor (a, b) e, a menos que q = b = 


= 0, T não é linear. Por quê? 
(Veja a observação depois do Exemplo 4.) 


5.3 CONCEITOS E TEOREMAS 


Separamos nesta secção os resultados que darão uma estrutura para um estudo 
mais fecundo das transformações lineares. 

Um fato importante sobre aplicações lineares é que elas são perfeitamente 
determinadas conhecendo-se apenas seu valor nos elementos de uma base. 
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; 5.3.1 Teorema: Dados dois espaços vetoriais reais V e W e uma base de V, 
{Yi o, Va), Sejam Wy ., Wn elementos arbitrários de W. Então existe uma 
única aplicação linear T: V> W tal que T(v,) = Wi, os Tlm) = Wn- 

Esta aplicação é dada por: 

Se V = aV +... + ann, 


TO) =mT(v) +.. + apT(vn) 
= 44W +.. +tanw, 


Verifique que T assim definida é linear e que é a única que satisfaz as 
condições exigidas. 


5.3.2 Problemas 


Problema 1: Qual é a transformação linear T:R? >R? tal que T(1, 0) = 
=(2, -1, 0) e T(0, 1) = (0, 0, 1)? 


Solução: Temos neste caso e, = (1, 0) e e, = (O, 1) base de R? e w; = (2, -1, 0) 
e w, = (0, 0, 1). 
Dado v = (x,, x2) arbitrário, 
V=Xe t Xe; 
e T(v) = x,T(e,) + xsT(e,) 
= x,(2, -1, 0) + x2(0, 0, 1) 
(2x1, -X1, X2) 


Problema 2: Qual é a transformação linear T:R? >R? tal que T(1, 1) = 
= (3, 2, 1) e T(0, -2) = (0, 1, 0)? 

Resolva o problema como exercício, mas, cuidado! Aqui não temos base canô- 
nica. Veja o Exercício 4a da secção 5.6. 

Vamos analisar mais profundamente as transformações lineares, obtendo 
alguns resultados úteis e ao mesmo tempo interessantes. Para começar necessita- 
mos definir imagem e núcleo, que são dois subconjuntos especiais dos espaços 
vetoriais envolvidos na definição da transformação linear. 


5.3.3 Definição: Seja T: V> W uma aplicação linear. A imagem de T é o 
conjunto dos vetores w E W tais que existe um vetor v € V, que satisfaz 
T(v) = w. Ou seja 


Im(T) = (we W, T(v)=w para algum v€ p} 
Observe que /m(T) é um subconjunto de W e, além disso, é um subespaço ve- 


torial de W. (Veja o Exercício 16 da secção 5.6.) Às vezes Im (7) é escrito co- 
mo T(V). 
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5.3.4 Definição: Seja T: V > W uma transformação linear. O conjunto de 


todos os vetores v E V tais que T(v) = O é chamado núcleo de T, sendo deno- 


tado por ker(T). Isto é 
ker(T) = {v € V; T(v) = 0} 


Observe que ker(T) C V é um subconjunto de V e, ainda mais, é um subes- 


paço vetorial de V. (Veja o Exercício 16 da secção 5.6.) 


Figura 5.3.1 


5.3.5 Exemplos 


Exemplo 1: 
T:R? >R 


(x, y)>x ty i 
Neste caso temos ker T = (x, y) E R?; x +y = 0}, isto é, ker T é a reta 


y = -x. Podemos dizer ainda que ker T = ix, -x); x E R} = {x(1, -1); 
x E€ R} = [(1, -1)]. Im T = R, pois dado w € R, w = T(w, 0). 


iImT=R 


Figura 5.3.2 
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Exemplo 2: Seja a transformação linear 
T:R? >R? dada por T(x, y, 2) = (x, 2y, 0). 
Então a imagem de T 
Im(T) = (x, 2y, 0): x, y € R} 
= {x(1, 0, 0) + )(0,2,0): x, yER} 
= «I, 0, 0), (0, 2, 0)) 
Observe que dim /m(T) = 2. 
O núcleo de T é dado por: 
ker(T) = {(x, y, z): T(x, y, z) = (0, 0, Q} 
(O, y, z): (x, 2y, 0) = (0, 0, 0)) 
= {(0, 0, z): 2 € R} 
= {z(0, 0, 1): 2 € R} 
= [(0,0, 1)] 


Observe que dim ker(T) =1. 


Vamos recordar agora as noções de função injetora e sobrejetora e posterior- 
mente estabelecer o relacionamento entre estes conceitos e os de núcleo e ima- 
gem quando a função é uma transformação linear. 


5.3.6 Definição: Dada uma aplicação (ou função) T:V > W, diremos que 
Té injetora se dados u € V, v E V com T(u) = T(v) tivermos u = v. Ou equi- 
valentemente, T é injetora se dados u, v E V com u =Æ v, então T(u) £ T(v). 


Em outras palavras, T é injetora se as imagens de vetores distintos são 


distintas. 


did Figura 5.3.3 


5.3.7 Definição: A aplicação T: V >W será sobrejetora se a imagem de T 
coincidir com W, ou seja T(V) = W. 


Em outras palavras, T será sobrejetora se dado w € W, existir v E V tal 
que T(v) = w. 


yw 


Figura 5.3.4 
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Exemplo 

T:R >R? 
x» (x, 0) 

Mostremos agora que se T é injetora, então ker T = (0 }. Seja v € ker (T), isto. 
Então (x, 0) = (y, 0) implicando que x = y. Logo T é injetora. Mas T não é 
sobrejetora uma vez que Im(T) + R?. 

A transformação do Exemplo 1 de 5.3.5 é sobrejetora mas não é injetora, 
e a do Exemplo 2 de 5.3.5 não é nem injetora nem sobrejetora. Um bom exer- 
cício seria você examinar os exemplos de transformações lineares dados até 
aqui e decidir se são injetoras ou sobrejetoras. 

O próximo teorema afirma que uma transformação linear injetora só tem 
o vetor nulo no seu núcleo. E, por outro lado, se uma transformação linear ti- 
ver somente O no núcleo, então quaisquer dois vetores distintos devem ter ima- 
gens distintas também. 


5.3.8 Teorema: Seja T:V > W, uma aplicação linear. Então ker(T) = (0), 
se e somente se T é injetora. 


Prova: Mostremos primeiro que se ker T = (0), então T é injetora. 
Suponhamos que u, v E V tais que T(u) = T(v). Então T(u) - T(v) = 
=T(u-vw=0,istoé,u-ve ker(T). Mas por hipótese o único elemento do 
núcleo é 0. Então u - v = 0, isto é, u = v. Em resumo: como T(u) = T(v) 
implica que u = v, T é injetora. 

Mostremos agora que se T é injetora, então ker 1 = {0}. Seja v € ker(T), isto 
é, T(v) = 0. Como necessariamente T(0) = 0, T(v) = T(0). Logo v = 0, pois 
T é injetora. Portanto, o único elemento do núcleo é 0, ou seja, ker(T) = {0}. 

Voltando ao Exemplo de 5.3.7, observe que podemos dizer se T é injeto- 
ra simplesmente calculando o seu núcleo. Para que (x, 0) seja o vetor nulo, de- 
vemos ter x = 0 e portanto ker T = (0), donde concluímos que T é injetora. 

Uma consequência da proposição 5.3.8 é que uma aplicação linear injeto- 
ra leva vetores LI em vetores LI. (Veja o Exercício 9 da secção 5.6.) 

Um resultado importante, que relaciona as dimensões do núcleo e imagem 
de uma transformação linear T: V> W, com a dimensão de V é dado pela se- 


guinte proposição. 


5.3.9 Teorema: Seja F:V > W uma aplicação linear. 


Então dimkerT + dimimT = dim V. 
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Prova: Considere v,, ..., vp Uma base de ker T. Como ker T C V é subespaço. 
de V, podemos completar este conjunto de modo a obter uma base de V. 
Seja então (vi, ..., Yn, Wis s Wm} à base de V. Queremos mostrar que 
T(wi), ..., T(wm) é uma base de im T, isto é, 
Ð [Two Tíwa)l = ImT 
ii) (T(wi), -.., T(wm)) é linearmente independente. 
Provemos i) 
Dado w € Im T, existe u € V tal que T(u) = w. Se u €E V, então 
U =d to tava + DW +. + bmWm. Mas, 
w=T(u)=Tavi to. + apYn + biw; +. tDbmWm) 
=0T(vi) +. tanT(vo) + b Tw) +... tbmT(wa) 


Como os vetores vi, ..., Vn pertencem ao ker T, T(v;) =0 para i=1,...n 
Assim, 
w = biT(wi) +. +tbyaT(Wm) 
e a imagem de T é gerada pelos vetores T(w)), ..., T(wm). 
ii) Consideremos agora, a combinação linear 


a T(w,) + a2T(w,) +... + am (wm) = 0 


e mostremos que os a; são nulos. 
Como T é linear, T(a,w, taw, +... t amWm) = 0. 
Logo aW; +... + amWm E kerT. 
Então aw; +... + amWm pode ser escrito como combinação linear da base 
tvi, ..., Va} de ker(T), isto é, existem d,, ..., bn tais que 
mw, +... +amWm = Div to. + DbnYa, Ou ainda, 
aW t.. tamwm- by ~- Onn =O 


Mas (Vi, os Yn, Wi, ., Wm) é uma base de V, e temos então a, = q, =... = 


.= äm = b; ss bp = O. 


Decorrem desta proposição dois resultados: 


5.3.10 Corolário: Se dim V = dim W, então T linear é injetora se e somente 
se T é sobrejetora. 


Faça a demonstração como exercício. 


5.3.11 Corolário: Seja 7:V > W uma aplicação linear injetora. Se 
dim V = dim W, então T leva base em base. 
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Prova: Considere {v}, ..., Yn} base de V. O conjunto (T(vi), - Tn) CW éLI 


pois dados escalares ks, ..., kn tais que A T(v)) + ... + knT (vn) = 0, temos 
T(kivi +... + kavn) = 0. Logo kivi +... + kavy = 0. Mas [vi sis Vn} é LI. 
Logo k =... = kn = 0. Desde que dim V = dim W = n, {T(v1), -~ T(Yn)} é 


base de W. (Veja 4.6.8.) 


5.3.12 Quando uma transformação linear T: V > W for injetora e sobreje- 
tora, ao mesmo tempo, dá-se o nome de isomorfismo. Quando há uma tal trans- 
formação entre dois espaços vetoriais dizemos que estes são isomorfos. Sob o 
ponto de vista de Álgebra Linear, espaços vetoriais isomorfos são, por assim di- 
zer, idênticos. Observe que devido à proposição 5.3.9 espaços isomorfos devem 
ter a mesma dimensão. Portanto, pelo corolário 5.3.11, um isomorfismo leva 
base em base. Além disso, um isomorfismo T:V >W tem uma aplicação inver- 
sa T!:W> V que é linear, como você poderia provar, e também é um isomor- 
fismo. 


Exemplo: Seja T:R? > R? dada por T(x, y, 2) = (x - 2y, z, x + y). Va- 
mos mostrar que T é um isomorfismo, e calculár sua inversa T. 

Se pudermos mostrar que T é injetora, teremos que T é um isomorfismo 
pelo corolário 5.3.10. Isto equivale a mostrar que ker T = {(0, O, 0)}. Mas 
ker T = xy 2); T(x, y, z) =(0,0,0) e T(x, y, 2) = (0, 0, 0) se e somen- 
te se (x - 2y, z, x + y) = (0, 0, 0). Resolvendo o sistema de equações lineares 


x-2y=0 
z=0 
xt y=0 


achamos que x = y = z = 0 é a única solução e portanto T é um isomorfismo. 

Tomando a base canônica de R?, sua imagem pela Té (T(1,0,0), T(O, 1,0) 
T(0, 0, 1) = (1,0, 1), (-2, 0, 1), (0, 1, 0)) que é ainda uma base de Rº. É 
conveniente que você verifique isto. Calculemos agora a aplicação inversa de T. 
Como T(1,0,0)=(1,0, 1), T(0, 1, 0) = (-2, 0, 1) e T(0,0, 1) = (0, 1, 0), 
temos que TH(1,0, 1) = (1, 0, 0), T (2,0, 1) = (0, 1, 0) e TO, 1, 0) = 
= (0, 0, 1). Queremos calcular T(x, y, z). Para isto escrevemos (x, y, Z) em 
relação à base {(1, 0, n - 0, 1), (0, 1, 0)}, obtendo: 


œ y, 2 = = (1,0, pas O, 1) + y(0, 1, 0). 


Então T(x, y, 2) = Rea 0,1) + SE TIS, 0, 1) + 37 H0,1,0). 


Ou seja, 


T(x, y, z) = ES + 2z ESA. y). 
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5.4 APLICAÇÕES LINEARES E MATRIZES 


Nesta seção veremos que num certo sentido o estudo das transformações linea- 
res pode ser reduzido ao estudo das matrizes. Você já viu no Exemplo 7 de 
5.1 que a toda matriz m X n está associada uma transformação linear: T:R” > R”. 
Vamos formalizar, a seguir, este resultado para espaços vetoriais V e W e 
também estabelecer o seu recíproco, isto é, veremos que uma vez tixadas as 
bases, a toda transformação linear T:V > W estará associada uma única matriz. 
inicialmente veremos como, dados dois espaços vetoriais V e W com bases 
B e 6” e uma matriz A, podemos obter uma transformação linear. 


5.4.1 Consideremos R? e as bases 


= (1,0), (0,1) e 8 =, D, (-1, 1} 


i 2 0 
e a matriz A = | 2 dl 


Queremos associar a esta matriz A uma aplicação linear que SR pENNE de A e 
das bases dadas ß e ß', isto é, 
Ta:R? > R? 
ve TA(v) 


Considere v = (x, y). Seja X = lvi = [5 | 


2 0 2x 
(é p] Bjos 


Figura 5.4.1 


Então, TA(v) = 2x(1, 1) + y(-1, 1) = (2x - y, 2x + y). 
Por exemplo, se v = (2, 1), então TA(2, 1) = (3, 5). Note que se tivéssemos 
partido de 8 = 8" = ((1, 0), (0, 1)}}, teríamos obtido TA(v) = (2x, y) = Av. 


vix, y) Talv) 


Figura 5.4.2 
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o + 
De um modo geral, fixadas as bases É = vi, Mm) eb = (wi, Wm), 
à matriz 
411 in 
À= : 
am - amn| mxn 


podemos associar 
Ta:R” >R”. 
vr> TA(v) como: 


X1 
Seja X = [v] = 
Xn 
an Cn X1 Yi 
A-X= = 
Gm Im Xn Ym 


Então, TA(V) = YiWi t+... + YmWm onde y; =A; Xe A; é a iésima linha 
de A. 

Em geral, dada uma matriz Am xn» ela é encarada como uma aplicação 
linear Ta: R” >R” em relação às bases canônicas de R” e R”. 


Exemplo: 
I1 -3 5 l 
a=; 4 4] 8=00.0,0, 1)} e 


8 = {(1, 0, 0), (0,1, 0), (0,0, 1)}. 
TA:R?>R?. Encontremos esta transformação linear. 


Então Ta(x, y, z) = (x - 3y + 5z)(1, 0) + (2x + 4y - Z)(0, 1) = 
= (x - 3y + 5z, 2x + 4y - z) 
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5.4.2 Agora iremos encontrar a matriz associada a uma transformação 
linear. Seja T: V> W linear, 8 = (vi, ..., vn) base de V eg' = (wi, Wm} 
base de W. Então T(v,), ..., T(v,) são vetores de W e portanto 


T(vi) = auw, +... tum Wm 


Tv) = anWi + + AmWm 


A transposta da matriz de coeficientes deste sistema, anotada por [T a é cha- 
mada matriz de T em relação às bases f e p’. 


qi ne. &in 
rÉ | | -A 


amı ... mn 


Observe que T passa a ser a aplicação linear associada à matriz A e bases 8 e 
b', isto é T=Ta. 


5.4.3 Exemplos 


Exemplo 1: 
Seja T:R? > R? tal que T(x, y, z) = (2x + y - z, 3x - 2y + 42). 
Sejam 8 = {(1, 1, 1), (1, 1, 0), (1, 0, Ọ} e 8 = {(1, 3), (1, 4}. 
Procuremos ITÉ. 
Calculando T nos elementos da base 8, temos: 
TU, 1,1)=(2,5)= 3(1, 3) - 1(1, 4 
T(1, 1, 0) = (3, 1) = 11(1, 3) - 8(1, 4) 
T1, 0, 0) = (2, 3)= 5(1, 3) - 3(1, 4) 


Então l 3 1 5 
rý- | -8 J 


ê r . 
Observe que se fixarmos outras bases É e É, teremos uma outra matriz 
para a transformação T. 


Exemplo 2: 
Seja T a transformação linear do Exemplo 1 e sejam 8 = ((1,0,0), 


(0, 1, 0), (0, 0, 1)} e B' = {(1, 0), (O, D+. 
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Calculemos Th. 
T1, 0,0 = (2,3)= 2(1, 0) + 3(0, 1) 
T(0, 1, 0) = (1, -2)= 1(1, 0) - 2(0, 1) 
T(0, 0, 1) = (-1, 4 = -1(, 0) + 40, 1) 


IrÉ, ; [5 1 a 


-2 4 


Então 


Observação: Usa-se denotar simplesmente por [T] à matriz de uma trans- 
formação linear T:R” >R” em relação às bases canônicas. Assim, no Exemplo 2 


Th = [T]. Também é comum usar-se a notação simplificada: Tv = T(v). 
Exemplo 3: Seja T:V > V 
vev 


Isto é, T é a identidade. 
Sejam 8 = (vi, .., Yn} e B' = (vi, . Yn) bases de V. Calculemos ITÉ. 


' ' 
Como Tv; = Vy = 4Y + ue t ZaYn 


+ t 
TVn = Yn = UnVi to. + annYn, 


di ... Gin 


a matriz mudança de base. Veja 4.7.1. 

Exemplo 4: Dadas as bases 8 = ((1, 1), (0, 1)} de R? e 8' = {(0, 3, 0), 
(1,0, 0), (0, 1, 1)) de Rº, encontremos a transformação linear T:R? > R? cuja 
matriz é 


Th = 


0 
1 
1 


w ON 


Interpretando a matriz, temos: 
T(1, 1) = 00, 3, 0) - 1(-1, 0, 0) - 1(0, 1, 1) = (1, -1, -1) 
T(0, 1) = X0, 3, 0) + O(-1,0,0) + 3(0, 1, 1) = (0, 9, 3) 
Devemos encontrar agora T(x, y). Para isto escrevemos (x, y) em relação à ba- 
se ĝ: 
(x, y) =x(1, 1) + © -x)(0, 1) 


Transformações Lineares 161 


Aplicando T e usando a linearidade, temos: 


Tix, y) =2TU, 1) + (py - »)T(O, 1) 
x(1, -l1, -1}) + (y - x) (0, 9, 3) 
(x, 9y - 10x, 3y -.4x) 
O resultado a seguir dá o significado da matriz de uma transformação 
linear. 


5.4.4 Teorema: Sejam V e W espaços vetoriais, a base de V, 8 base de W 
e T:V >W uma aplicação linear. 
Então, para todo v € V vale: 


[T(v) p= Ty lvl 


Figura 5.4.3 


Para ficar mais fácil a compreensão faremos a demonstração no caso dim V = 2 
e dim W = 3. O caso geral é totalmente análogo e pode ser feito como exercí- 
cio. 


Prova: Sejam a = (v,, V2} base de Ve B = (wi, W2, Wa) base de W e 


Gm an xı Yı 
IT =] q, &ņ l. Sejamaindave Ve [viy = H e [Tv] = | J2 
Ia azn J3 


Da matriz ITI sabemos que 
Tvi = dW; + d2 W2 t a31W3 
Tv, = áW + aW t az W3 


Além disso, v = x;Vı + x), e como T é linear, 


Tv = x, Iv, t x,Tv; 
= Xi(d Wi + d3Wa t daW3) + Xa(d12W1 + a22W3 + dnWs) 
= (41X + ay2X2)W) + (42X; + 22X2)W2 + (03X, + a3X2)W3. 


Mas Ty = yW; + JoWa + y3W3 € como as coordenadas em relação à base 8 


são únicas, temos 
i yı = UnX t än% 
Yı = aX t lnXz 
y3 =änXı t lyx 


Biblioteca de 
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ou seja, 
Yı 4i n x 
Y2| = |n an E 
Y3 da ly E 


Isto é, LTvlg = ITI lvl 


Através deste teorema, o estudo de transformações lineares entre espaços 
de dimensão finita é reduzido ao estudo de matrizes. Quando V = We T=t, 
observe que o resultado é o mesmo da matriz de mudança de base dado em 
4.7.1. 

Exemplo: Seja a transformação linear T:R? >R? dada por 


[ZMÊ=|0 1 
B Jg 


onde æ = {(1, 0), (0, 1)} é base de R?, 8 = ((1,0, 1),(-2,0, 1), (0, 1, 0)} é 
base de R?. Queremos saber qual é a imagem do vetor v = (2, -3) pela aplica- 
ção T. Para isto, achamos as coordenadas do vetor v em relação à base a, 


obtendo Ivk = Bi a seguir, usando o teorema, temos 


1 -l 5 
[7v = [Tike = |0 1 E | = |-3 
-2 3 -13 


ou seja, 
Tv = 5(1, 0, 1) - 3(-2, 0, 1) - 13(0, 1, 0) 
= (11, -13, 2) 


O relacionamento entre as dimensões do núcleo e da imagem de uma 
transformação linear e o posto de uma matriz a ela associada é dado no teore- 
ma a seguir, cuja demonstração deixamos ao seu encargo. 


5.4.5 Teorema: Seja T: V >W uma aplicação linear e œ e $ bases de V e 
W respectivamente. Então 
dim /m(T) = posto de [7h 
dim ker(T) = nulidade de [T] 


número de colunas - posto de IT. 
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5.4.6 Teorema: Sejam T: V >W e To:W> U transformações lineares e a, 
B. y bases de V, W e U respectivamente. Então a composta de T, com T}, 
ToT: V> U, é linear e 


moni = mÉ Eri 


© 


WwW 
F N 
Y ——— U 
TaOTı 


Figura 5.4.4 


A demonstração desse teorema é direta mas bastante trabalhosa. Por esta 
razão não a faremos aqui, indicando apenas suas etapas. Podemos efetuá-la sim- 
plesmente lembrando a construção das matrizes das transformações T, e T3, 
obtendo desta forma suas atuações sobre as bases respectivas. A seguir, por 
composição achamos o que ToT, faz na base de V, e chegamos então à matriz 


Ton, observando que esta é exatamente o produto das matrizes anteriores. 


5.4.7 Exemplos 


Exemplo 1: Consideremos uma expansão do plano R? dada por 
Ti(x, y) = 2(x, y), e um cisalhamento dado por T3(x, y} = (x + 2y, y). Ao 
efetuarmos primeiro a expansão e depois o cisalhamento, teremos a sequência 


Ti T? 
——— q ——+ 
MIA ) Z 
i 
ToT 
Figura 5.4.5 
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As matrizes (em relação à base canônica de R*, £) das transformações são 


mieg Je m-i 1] 


Então, a matriz (em relação à base canônica de R?) da aplicação que expande 
e cisalha (que é justamente a composta T,0T,) será 


Lo ihle ajele 3 


Exemplo 2: Sejam as transformações lineares T: R?> R’ e T:R? > R? 
cujas matrizes são 


en 


0 


ij emb-[8 0 5] 
1 


em relação às bases a = {(1, 0), (0, 2)), 8 = ($. 0, -3), (1, 1, 15), (2, 0, 5)} 
e y = 42,0), (1, 1)). Queremos encontrar a transformação linear composta 
ToT R? > R?, ou seja, precisamos achar (T,0T,)(x, y). 

Para isto, usamos o teorema anterior para achar a matriz da composta. 


1 0 
a [O 1 -~i = (sd 
rone- [0 0 ' M E o] 
0 1 
Escrevemos agora as coordenadas do vetor (x, y) em relação à base a. 


A 
[œ y) = | y | 


Então, usando o teorema 5.4.6, temos 


xX = 
(TT) 9h = k a] B E j o] 
2 


[rg = 


O = 


Portanto, (TiºT O, y) = (x - y)(2, 0) + O(1, 1) = (2x - 2y, 0). 
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5.4.8 Corolário: Se T: V> W é uma transformação linear inversível (T é 
um isomorfismo) e a e 8 são as bases de Ve W, então T1I:W->V é um ope- 
rador linear e 


LT É = dr 


Figura 5.4.6 
Prova: A matriz identidade, [£ = [TOT = IT É ITA 


5.4.9 Corolário: Seja T: V> W uma transformação linear e œ e 8 bases de 


V e W, Então T é inversível se e somente se det IT Ia Æ+ 0. 


Exemplo: Seja T:R? >R? uma transformação linear dada por 


onde ; é a base canônica de R?. Como det IT = 1, o corolário 5.4.9 afirma 


que T é inversível. Pelo corolário 5.4.8 sabemos que 


-iJ a ER A AE 3 -4 
pras e 


KE 3r aá x 
Então [T(x y) = [T far E É | B E E + | 


ou seja, Tt, y) = (3x - 4y. -2x + 3»). 


Se T: V > W é uma aplicação Jinear, &, a' bases de Ve 8,B' bases de W, 
podemos relacionar as matrizes [Ti e iri do seguinte modo: 
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5.4.10 Corolário: 


= e 


Figura 5.4.7 


IT = oTo = UG TU 


Em palavras, conhecendo a matriz de uma transformação linear em relação a 
certas bases œ e 8 e as matrizes de mudança de base para novas bases a eg, 
podemos achar a matriz da mesma transformação linear, desta vez em relação 


às novas bases q e ß'. 


Como caso particular da situação anterior temos: 
Se T: V> V é uma transformação linear e œ e 8 são bases de V, então 


Figura 5.4.8 


TE = Loto = UB TUÉ, 
Lembrando que uÉ = drg e chamando Lj = A, vem que 
ITÉ = AURA 


: ii O m 
Dizemos neste caso que as matrizes [T]; € Th são semelhantes. 


Pelo corolário anterior, observamos através de mudanças convenientes de bases 


qual a modificação que a matriz de uma transformação linear sofre. 
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Exemplo: Seja a transformação linear T:R? >R? cuja matriz em relação 
à base canônica ¢ é 


E 4 -4 
MÉ=|[12 ı 
3 6 


Calculemos a m desta transformação em relação à base a 
(-1, 0, 1), (1, 1, 1)}. Para isto, usamos a relação [r = = Uig [T] I É onde 


O 1 1 2 4 
vÊ=|1 o o e d= uÈ“ =|o 41 
ol I -l 1 
Então 100 
Th = 022 
0 00 


Isto nos sugere a pergunta: Dada uma transformação linear, há um proce- 
dimento prático para se calcular uma base em que a matriz desta transformação 
seja a “mais simples possível”? A resposta a esta pergunta será um dos nossos 
objetivos nos próximos dois capítulos. 


*5.5 APLICAÇÕES À ÓPTICA 


Consideraremos nesta secção o caso de um feixe de luz de raios paralelos (cuja 
direção pode, portanto, ser dada por um vetor) que se reflete em espelhos 
planos. 

Iniciamos observando a situação mais simples possível: a propagação se dá 
no R° (isto é, estamos observando o fenômeno de perfil) e o espelho está co- 
locado no eixo horizontal (veja a Figura 5.5.1) 


raio de luz 


Piada refletido na 

direcã 
a ireção (c, d) 
(a, bì) 


espelho 


Figura 5.5.1 
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Dado um raio de luz incidente na direção do vetor (a, b), perguntamos 
em que direção (c, d) estará o raio refletido? 

Para responder a esta pergunta devemos recordar um pouco sobre as leis 
que regem a reflexão da luz em um espelho. São elas: 


i) O raio de luz incidente, a normal ao espelho no ponto de incidência 
e o raio refletido estão no mesmo plano. 
ii) O ângulo entre o raio incidente e a normal ao espelho é o mesmo que o 
ângulo entre a normal e o raio refletido. 
ii) Supondo que o espelho é perfeito, isto é, não há absorção da luz, a luz 
se reflete com a mesma intensidade que tinha na incidência. 
No caso simples que temos, não precisamos nos preocupar com (i) pois 
as propagações se dão no mesmo plano. Se o comprimento do vetor indicar a 
intensidade da luz, (iii) indica que o vetor refletido terá o mesmo tamanho que 
o incidente. Estes resultados, juntamente com (ii), implicam que c = a e d=-b, 


ou, em forma de matriz 
a DR Q a 
d 0 -1 b 


Podemos concluir, portanto, que um espeiho plano atua sobre os raios 
luminosos como uma transformação linear E (compare com 5.2.2). 

Passemos agora a estudar qual é a matriz associada a um espelho numa 
posição um pouco mais geral (veja a Figura 5.5.2), isto é, formando um 
ângulo 8 com a horizontal. 


Figura 5.5.2 


(a, b} 


` 


Podemos fazer este caso cair na situação anterior considerando uma mu- 
dança de base. Tomamos a base 8 = {e}, e3} onde e, = (cos 8, sen 0) está na 


direção de x' (espelho) e e; = (cos + 8), sen G + 0) = (-sen ĝ, cos 8) 


está na direção normal ao espelho. Em relação a esta base 


ato do 0 
w= [5 4) 
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Portanto, em relação à base canônica temos (verifique, calculando 


Ê can 
l) i; ) 


can ` 
[E = E ER pen = |cos20 sen 29 
B g sen 29 cos 28 

e, portanto: 


5.5.1 E _ |c0s28  sen20 | [a 
d sen 28 cos 20 b 


: can : : f 
. A BEF [E] eai poderia ser obtida diretamente simplesmente observando 
que a transformação linear (o espelho) faz nos vetores da base canônica 


(raios luminosos na direção do eixo dos x e dos y). (Veja a Figura 5.5.3.) 


(cos 20, sen 20) 


(0, 1) 
espelho 


x 


(cost $- 20), -sent $- 20)) 
= (sen 20, - cos 20) 


Figura 5.5.3 


Note que ao colocarmos as componentes dos vetores refletidos em coluna 
obteremos a mesma matriz que antes, 

Como podemos tratar o problema em que hajam vários espelhos e, con- 
sequentemente, reflexões sucessivas? Simplesmente pela composição das trans- 
formações lineares associadas a cada espelho na ordem em que ocorrem as 
reflexões ou, em termos de matriz, pelo produto das matrizes na ordem 
correta (veja 5.4.6). 

Vamos exemplificar analisando a situação seguinte: um feixe de luz se 
propagando na direção do vetor (1, -1) e refletindo nos espelhos da figura: 


Em que direção estará o feixe após as reflexões? 
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q 
Para responder a isto basta utilizar a matriz de 5.5.1 com 0 =- para à 


primeira reflexão e O = = para a segunda. Temos então (verifique): 
€ 1 -Bj 3 1 1+43 
Jz E E -7 ? 
AB aA ja aj ETE 
d 2 2 2 2 -1 2 
; -1+/3 1-V3 
Concluímos, então, que o feixe estará na direção de aa , sa ) 


O mesmo raciocínio poderá ser feito quando estamos com espelhos planos 
no espaço. Façamos um exemplo. Vamos mostrar que se tivermos 3 espelhos 
colocados dois a dois perpendiculares, qualquer feixe de luz de raios paralelos 
que incide sobre o conjunto sairá paralelo à direção de incidência após as refle- 
xões (veja a Figura 5.5.4). 


Figura 5.5.4 


As matrizes associadas a cada espelho podem ser obtidas observando o que ele 
faz com cada um dos vetores da base canônica. Obtemos então: 


-1 0 0 1 0 0 1 0 0 
M, = o 1 0L,M=|0 -1 0| M= |O 1 
0 01 0 01 o 0 -l 


para os espelhos I, H e MI respectivamente (verifique). Se o feixe de luz 
incidente está na direção (a, b, c) a direção do feixe refletido pelo conjunto 


será 


d a -4 
e zg Ms, M.;* Mı. b = |-b 
f c -c 


O mesmo resultado será obtido se as reflexões se derem em outra ordem 
(M,MsM,, M,M2M; etc.). Podemos concluir, portanto, que a direção de saída 
é paralela e contrária à de entrada. 

A reflexão da luz (ou som) feita em espelhos não planos não é descrita 
por transformações lineares. Você verá alguns exemplos de espelhos não planos 


em 11.7. Aguarde! 
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5.6 EXERCICIOS 


1. Seja T: V > W uma função. Mostre que: 


a) Se T é uma transformação linear, entã 
a , oT 0) = 0. 
b) Se T(0) # 0, então T não é uma Eaa a linear 


2. Determine quais das seguintes funções são aplicações lineares: 
a) f:R? > R? f 
(x, y) (x + y, x - y) 
b) g:R? >R 
(x. y) xy 
c) h:M, >R 


a b a b 
É E |— derf 5 E] 
d) k:P,>P, 


2 
ux? + bx + c > ax? + bx? + cx 
e) M:R? >R? 


1 2 
(x, y, z — (yo -I 
La 

A NR>R 


xr lx] 


3. a) Ache a transformação linear T:R? >R? tal 
: que T(1, 0, 0) = (2, 0), 
T(0, 1, 0) = (1, 1) e T(0, 0, 1) = (0, -1). Fa 
b) Encontre v de R° tal que T(v) = (3, 2). 


4. a) Qual é a transformação linear T:R? >R? tal 
; que T(1,1)=(3,2,1 
T(O, -2) = (0, 1, 0)? di a 
b) Ache T(1, 0) e T(O, 1). 
c) Qual é a transformação linear S:Rº—> R? tal que S(3, 2 
E 2 , 1 = l, l > 
S(0, 1, 0) = (0, -2) e S(0, 0, 1) = (0, 0)? 
d) Ache a transformação linear P:R? > R? tal que P = Sor 


5. a) Ache a transformação T do plano no plano que é uma reflexão em torno 
da reta x = y. 
b) Escreva-a em forma matricial. 


6. No plano, uma rotação anti-horária de 45º é seguida por uma dilatação de 
V2. Ache a aplicação 4 que representa esta transformação do plano. 
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7. Qual é a aplicação 4 que representa uma contração de a seguida por 


uma rotação horária de 45°? 


8. Verifique qual o núcleo é imagem e suas respectivas dimen 
mações dadas nos exemplos do parágrafo 5.1. 


9. Dados T:U > V linear e injetora e ui, Uz2, ~- 
que (T(us), ..., T(uk)) é LI. 


10. Sejam R, S e T três transformações lineares de R? em R°. 


l 0 1 
Se [R]=|2 1 1je 
0 -l 


1 
-2 1 -i 
[S]=!3 1 2], ache 
1 -2 0 


T tal que R = SOT. 


11. Sejam a = {(1, -1), (0, 2)} e 8 = (01,0, -1), (0, 1, 2), (1, 2, 0)} bases de 


R? e R? respectivamente e 


rg- 


a) Ache T. 
b) Se S(x, y) = (2y, x - y, x), ache [ST 


=- 0o 


| 


-1 
12. Se [R] = É É e [S] = E E E ache ROS. 


13. Se R(x, y) = (2x, x - y, y) e S(x, y, D)=0-22- x), 


a) Ache [ROS]. 
b) Ache [SOR]. 


1 
c) Ache uma base y de R? tal que iri = [o 
0 


sões das transfor- 


uk, vetores LI em U, mostre 


Transformações Lineares 173 


14. Seja V o espaço vetorial de matrizes 2 X 2 com base 


e=ilo o) lo o) lt ole 0) 


Se T:V>R? é ai 
R? é dada por r [|6 A =(@ +d, b+o), 
a) Ache rÉ onde a é a base canônica de R?, 


l 
Se S:R?> V as -1 
e e [Sh i 


0 1 


b) Ache S e, se for possível, (a, b) tal que S(a, b) = lo i 
i O 1l. 


15. Seja T:R? > R? zaet, 42 

eja R? tal que [T] = | o qJ- Ache os vetores u, v tal que 
a) T(u)= u 
b) T(v) = -v 


16. Mostre que se T: V> W é uma transformação linear, 


a) Im(T) é um subespaço de W. 
b) ker(T) é um subespaço de V. 


17. Sejam S e T aplicações lineares de Vem W. Definimos S + T como 
(S + T)v = S(v) + T(v) para todo v E V e definimos aS como (aS)v = 
=» S(v) para todoa ERev€ vr. 
a) Mostre que S + T é uma transformação linear de V em W. 
b) Mostre que aS é uma transformação linear de V em W. 
c) Mostre que X = {T | T: V> W} é um espaço vetorial sobre R. 
d) Suponha que dim V = 2 e dim W = 3. Tente procurar dim X. 


18. No Exercício 11 determine ker T, Im T, Im S, ker S e comprove a validade 
dos teoremas 5.3.9 e 5.4.5 para estas transformações. 


19. Considere a transformação linear 
T:R? >R? dada por T(x, y, z) = (Z, x-y, -2). 
a) Determine uma base do núcleo de T. 


b) Dê a dimensão da imagem de T. 
c) T é sobrejetora? Justifique. 


d) Faça um esboço de ker T e Im T. Biblioteca de G 
Ciència & Tecno 


Pe! 


l dia 
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25. Seja T: R? > R? uma reflexão, através da reta y = 3x 


20. Dê, quando possível, exemplos de transformações lineares T, S, L MeH 
a) Encontre T(x, y). 


satisfazendo: 
a) T:R? > R? sobrejetora b) Encontre 

b 2 & 
b) SR? > Rº, com ker S = ((0,0, 0)} à base a de RÉ, tal que [TT = f i 
c) L:R? > R?, com Im L = 0, 0)} j 
DMR? > R?, com kerM= {(x, y) € R?; x =y} 
e) H:R? > RÌ, com ker H= {(x, y, z) € R?; z =x) 


26. Seja T: R? > R? ond Tra 
e e onde T(v) é a projeção do vetor v no plano 


21. Seja P; = conjunto dos polinômios com grau menor ou igual a 3, e a) Encontre T(x, y, z). 
T:P, > P3 
f>f' (derivada) 


b) Encontre uma base ordenada 8 de Rº, tal que 


a) Mostre que P} é um espaço vetorial de dimensão 4. r= 1 0 0 
b) Mostre que T é uma transformação linear. [ Ja E 5 o 0 
0 1 


c) Determine ker T e Im T e encontre uma base para cada um destes 
subespaços vetoriais. 


27. Seja L: R? > R? onde L é a reflexão através do plano 


22. Seja D:P; > P3 
3x + 2y +z=0Q. 


ff" (derivada segunda) 
Mostre que D é linear e determine uma base para ker D. 
a) Encontre L(x, y, 2). 


b) Encontre uma b 3 
23. Sejam « = {(0, 2), (2, -1)} e 8 = {(1, 1, 0), (0,0, -1), (1, 0, 1)} bases ma base ordenada y de Rº, tal que 


E 1 0 0 
ITË =/0 1/0 
F 2 0 0 0 -I 
[Sa =|4 0 
-4 
Dê a expressão para S(x, y). 
28. Encontre a expressão da transformação linear T : R? > R? que é uma 
rotação de 7/3 em torno da reta que passa pela origem e tem a direção 
A do vetor (1, 1, 0). 
0 1 o 0 
A = 0 2 B = 1 2 1 
01 -1 0 0 s 
29. Um espelho plano está apoi 
| o poiado em uma parede vertical formand ân- 
Encontre ker T}, Im T4, ker Tọ, Im Tp, ker (Too Tlm 0 T4 ). Determí- gulo de 30° com ela. Se um feixe de luz de raios paralelos for iiio è 


ne bases para estes seis subespaços. ticalmente (do teto para o chão) determine a direção dos raios refletidos 


176 ÁLGEBRA LINEAR 


*30, Um espelho plano triangular é apoiado no canto de uma sala da forma des- 


crita na figura abaixo. 


Em que direção será refletido um feixe de luz de raios paralelos emitidos 


verticalmente de cima para baixo? 


5.6.1 Respostas 


3.a) Tœ y, z) = (2x + y, y - 2) 
b) v = (x, 3 - 2x, 1 - 2x) 


5. a) TE, y) = O, x) b) E 


7. A(x, y) = (>. E) 


nTen = (552, 552,28 +9) 


2 
022 12 

13. a) [ROS] = | l - b) [SOR] = E | 
-1 0 1 

15. a) v = (x, -x) b) v = (x, 0) 


17. d) dim X =3X2=6 


19. a) ker T = [(1, 1,0)] base = {(1, 1,0)) 
b) dim im T =3 - dim ker T = 2 Veja (5.3.9). 
c) Não. dimim T = Z; 


re 


2 


23. 


25. 


27. 
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d) z 


ai ker T 


- a) (Veja Exemplo 4 de 4.2.2) base deste espaço: {1, x, x?, x°} 


b) (Veja Exemplo 5 de 5.1.2) 
c) ker T = (P(x) = k (constante)) base: (1) 
ImT = {F{x) = ax? + bx +c,a, b,c ER} base: {1, x, x!) 
_ 3 x 

S(x, y) = (y ES Ao Y t> -3x - 2y). 
ker Tp = {x, y,z) E R?;x =0ez= : 

B `Y, :X ez=2y) base: (0,1,-2)) 
Im Ty = [(0,1,0), (0, 1,-1)] base: {(0, 1,0), (0,1, -1)) 
ker T, = [(1,0)] Im T= [(1,2,1)] 
ker Tao T} = [01,0] Im Too T, = [(0,0,1)] 


_ 1 
a T &œ,y)= z (4 + 3y, 3x - 4y) 
b) a pode ser qualquer base {v;, v3 } tal que v, pertença à reta e v; e vz sejam 
perpendiculares, por exemplo, a = {(1, 3), (-3, 1)} 


l 
a) T(x, y, z) sq Cx - 6y - 3z, -6x +3y-22,-3x - 2y + 62) 


b) y pode ser qualquer base {v}, V2, Va }do R? tal que v; e v} pertençam 


ao plano e vs seja normal ao plano dado. Por exemplo, y = {(1, 0 
. , Ez 2 Y, -3 > 
(0, i; -2), (3, 2, 1)}. á i 
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AUTOVALORES E 
AUTOVETORES 


6.1 INTRODUÇÃO 


Dada uma transformação linear de um espaço vetorial nele mesmo, T: V > V 
gostaríamos de saber que vetores seriam levados neles mesmos por esta trans- 
formação. Isto é, dada T:V > V, quais são os vetores v E V tais que T(v) = 

= v? (v é chamado vetor fixo). Tentaremos elucidar esta questão, considerando 
algumas transformações que já foram estudadas no capítulo anterior. 


6.1.1 Exemplos 


Exemplo 1: 

IR? > R? (Aplicação identidade) 

œ, y) (x, y) 

Neste caso, todo R? é fixo uma vez que I(x, y) = (œ, y), para todo (x, yER. 
Exemplo 2: 

rx :R? > R? (Reflexão no eixo-x) 

(x, y) (x, -y) ou 
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Geometricamente 
Fx 
e 
w 
rx) =v 
y 
ryild E w 
Figura 6.1.1 


Intuitivamente podemos notar que todo vetor pertencente ao eixo-x é mantido 
fixo pela transformação ry. De fato: 


I (0 x x 
o a llol jo, 
ou seja, rx (x,0) = (x,0). 


Ainda mais, estes vetores são os únicos com esta propriedade, visto que, 


procurando vetores E tais que 


caímos no seguinte sistema: 


ou 


+ 
» 
i 
x 


-y =) 


As únicas soluções deste sistema são vetores do tipo (x, 0), ou seja. são os 
vetores pertencentes ao eixo-x. 
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Exemplo 3: 
N:R? > R? (Aplicação nula) 
(x, y}. (0, 0) 
Neste caso, o único vetor que é fixo pela aplicação dada é o vetor nulo, 
N(O, 0) = (0, 0). 

Passaremos agora para O seguinte problema: Dada uma transformação 
linear de um espaço vetorial T: V > V, estamos interessados em saber quais 
vetores são levados em um múltiplo de si mesmo; isto é, procuramos um ve 
tor v E V e um escalar À E R tais que 


T(v) = Av 


Neste caso T(v) será um vetor de mesma “direção” que v. Por vetores de mes- 
ma “direção” estaremos entendendo vetores sobre a mesma reta suporte. 

Como v = O satisfaz a equação para todo À, estaremos interessados em 
determinar vetores v + O satisfazendo a condição acima. O escalar À será cha- 
mado autovalor ou valor característico de T e o vetor v um autovetor ou ve- 
tor característico de T. Vamos formalizar este conceito. 

Passaremos doravante a dar a designação usual de operador linear para 
uma transformação linear T:V > V (de um espaço vetorial nele mesmo). 


6.1.2 Definição: Seja 7:V > V um operador linear. Se existirem v € V, 
vA0ehAER tais que Tv = Av, À é um autovalor de T e v um autovetor 


de T associado a À. 
Observe que À pode ser o número 0, embora v não possa ser O vetor 
nulo. Daremos a seguir exemplos de como calcular autovalores e autovetores, 


usando a definição. 


6.1.3 Exemplos 


Exemplo 1: 


E JBE i] 


ve 2v 
Neste caso, 2 é um autovalor de T e qualquer (x, y) + (O, 0) é um autovetor 
de T associado ao autovalor 2. Observe geometricamente: 
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Tiv =X 


Figura 6.1.2 


De um modo geral toda transformação 


T:R? > R? 
vbav, q #0 


tem « como autovalor e qualquer (x, y) + (0, 0) como autovetor corresponden- 
te. Observe que T(v) é sempre um vetor de mesma direção que v. Ainda mais 
+ 


i) a< 0, T inverte o sentido do vetor. 
ii) la] >1,7T dilata o vetor. 

üi) lal <1, T contrai o vetor. 

w) œ=1,T éa identidade. 


Exemplo 2: 
rx :R? >R? (Reflexão no eixo-x) 
&, y) (x, -y) 


Os vetores da forma A são tais que 


1 oilo( 10). 1 0 

0 -l y -y X|. 
Assim, todo vetor (0, y), y # 0, é autovetor de ry com autovalor À = -1. 
Como já vimos no Exemplo 2 da seção 6.1.1 os vetores (x, 0) são fixos por 


esta transformação, ry(x, 0) = 1(x, 0), ou seja, (x, 0) são autovetores corres- 
pondentes ao autovalor 1. 
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Fx 


Figura 6.1.3 


Exemplo 3: 
T:R? >R? (Rotação de 90º em torno da origem) 


E E a 


Note que nenhum vetor diferente de zero é levado por T num múltiplo de si 
mesmo. Logo, T não tem nem autovalores nem autovetores. 

Este é um exemplo de que nem todo operador linear possui autovalores 
e autovetores. Este fato será comentado melhor posteriormente (veja O Exemplo 


2 de 6.2.2) 
Exemplo 4: 


Seja A [2 dl 
voo a+[5]-[3 :]5])-[25* 


e Ta (x y) = 2x + 2y, y). 


Para procurar os autovetores e autovalores de TA resolvemos a equação 


Ta(v) = Av ou 
2x + 2y E x] _ Ax 
y y N 


Assim, temos o sistema de equações 
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»=ày 


Consideremos os casos quando i) y + 0 e ü} y =Q. 
i) Se y + 0, então da segunda equação À= 1. 


1 
Logo 2x + 2y =x e y= -3*. Obtemos assim, para o autovalor 
X = 1, os autovetores do tipo (x, - 5 x), x + O. Em outras palavras, 


1 1 
como T(x, s x) = I(x, - 3 x), os vetores sobre a reta x = -2y são 
mantidos fixos pela transformação T. 


ii) Se y = 0, x deve ser diferente de O, pois senão o autovalor (x, y) serja 
nulo, o que não pode acontecer pela definição de autovetor. Da primei- 
ra equação, 2x + O = àx ou À = 2. Portanto, outro autovalor é 2 e qual- 
quer vetor não nulo (x, 0) é um autovetor correspondente. Então, todos 
os vetores sobre o eixo-x são levados em vetores de mesma direção: 

T(x, 0) = (2x, 0) ou Nv) = 2v. 


Temos assim, para esta transformação T, autovetores (x, -4 x), 


x + 0, associados ao autovalor 1 e autovetores (x, 0), x + 0, associados ao 
autovalor 2. Todos os outros vetores do plano são levados por T em ve- 
tores de direções diferentes. 


6.1.4 Teorema: Dada uma transformação T:V > V e um autovetor v 
associado a um autovalor À, qualquer vetor w = av (a + 0) também é autove- 
tor de T associado a À. 

Observe isto nos exemplos e mostre que em geral isto é válido. Mais 
ainda, mostre que o conjunto formado pelos autovetores associados a um auto- 
valor À e o vetor nulo é um subespaço vetorial de V, isto é, PA = 
= {v € V:T(y) = Av) é subespaço de V. (Veja o Exercício 20 da secção 6.3). 
Vamos dar um nome a este subespaço. 


6.1.5 Definição: O subespaço Vy = {v € V:T(y) = Av) é chamado o 
subespaço associado ao autovalor À. 


As noções de autovetor e autovalor de uma transformação linear (ou 
matriz) são fundamentais por exemplo em Física Atômica porque os níveis de 
energia dos átomos e moléculas são dados por autovalores de determinadas ma- 
trizes. Também o estudo dos fenômenos de vibração, análise de estabilidade de 
um avião e muitos outros problemas de Física levam à procura de autovalores e 
autovetores de matrizes. 
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No Capítulo 12 você terá uma idéia de como as noções de espaço veto- 
rial, autovalores e autovetores são utilizadas na resolução de sistemas de equa- 
ções diferenciais, e muitas situações físicas são descritas por um sistema de 
equações diferenciais. (Veja O Exemplo 3 de 12.2.1 e os Exercícios de 12.4.) 

Outra aplicação importante que estamos visando é a classificação de côni- 
cas e quádricas que será vista no Capítulo 11. Nela, autovalores e autovetores 
serão usados para “normalizar” formas quadráticas. Mais especificamente, eles 
serão usados para encontrar mudanças de referencial que permitam identificar 
quais as figuras geométricas que representam certas equações no plano e no 


espaço. 
6.1.6 Autovalores e Autovetores de uma Matriz 


Dada uma matriz quadrada, A, de ordem n, estaremos entendendo por 
autovalor e autovetor de A autovalor e autovetor da transformação linear 
Ta :R” >R”, associada à matriz A em relação à base canônica, isto é, 
Ta) = Ay (na forma coluna). Assim, um autovalor À € R de A, e um 
autovetor v € R”, são soluções da equação A + y = Av, v O. 


Exemplo: Dada a matriz diagonal 


dn 0 ias 0 
Es 0 d2 0 
0 0 Gm 


u 


e dados os vetores e; = (1, 0, ..., 0), e2 = (0,1,0,..., 0), ...; en 
=(0,0,..., O, 1), temos 


aii 
A-e =| . |[=ane, e em geral, 
0 
A - e; = aje;. Então, estes vetores da base canônica de R” são autovetores 
para A, e O autovetor e; é associado ao autovalor ai. 


Veremos na próxima secção que dada uma transformação linear 
T: V> Ve fixada uma base É podemos reduzir O problema de encontrar 
autovalores e autovetores para T à determinação de autovalores para a matriz 


TIÊ 
Ui 
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6.2 POLINÔMIO CARACTERISTICO 


Observamos nos exe ï i 

ções de eG e sa e Ci a 

valores, estaremos adotando ù ga aa a 

mos procurar um método Em E a 

PRA o ipa encontrar autovalores e autovetores de 

Eden À n. Faremos um exemplo para o caso em que 
generalizaremos para n qualquer. 


Exemplo: 
4 2 0 
À = -1 ] 0 
0 1 2 


sra vetores ve R? e escalares XE R tais que A » v = àv. Obse 

q l or a matriz identidade de ordem 3, então a equação acim er 
escrita na forma Av = (A)v, ou ainda, (A - ADyv = 0 sia 
Escrevendo explicitamente l 


4 2 0 À 0 0 x 0 
-1 1 0|-10 à O »|=|0 
0 12 0 0 À z 0 
Temos então a seguinte equação matricial: 
4-A 2 0 x 0 
-1 L-A 0 »|=|0 
0 l 2-Aj}z 0 


Se escrevermos explicitamente o sistema de equações lineares equival 

equação matricial, iremos obter um sistema de três equações E a esta 
Se o determinante da matriz dos coeficientes for diferente de zero PS 
que este sistema tem uma única solução, que é a solução nula, o Sae oS 
=y =z =Q. (Veja a observação final de 3.7.2.) Mas estamos is ee aa 
calcular os autovetores de A, isto é, vetores v Æ O, tais que (A e racor om 
Neste caso det(A - AI) deve ser zero, ou seja É MNN: 
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3 2 = 0. 

i ea = sk Sie ni OBS em à. Este polinômio é chama- 
do o polinômio característico de A. Continuando a resolução, temos 

2 = 
Re Ei e 1 = 3 são as raízes do polinômio e 
portanto os autovalores da matriz A são 2 e 3. pira au alga 
podemos encontrar os autovetores correspondentes. Resolvendo a equaç 
Av = Av, para Os casos: 


D A= 
4 2 0l||x x 4x + 2) E 
E = áy 
-1 1 Ollyj=2» >4 -xt y 
012 P z} y+2=2 


i i unda que 
A terceira equação implica que y = O e por isso Vemos na seg aa E a 
x = 0. Como nenhuma equação impõe uma restrição em z, os penta a 
associados a À = 2 são do tipo (0, O, z), ou seja, pertencem ao p 


[(0, 0, D1. 
i) A=3 i 
Resolvendo a equação Av = 3v, temos 
4x + 2y = 3x 
xt y = 3y 
y+ 2z=3z 


Tanto da primeira equação quanto da segunda vemos que x = -2y $ a 
terceira vem z = y. Os autovetores associados ao autovalor À = 3 são 
tipo (-2y, y, y), Ou seja, pertencem ao subespaço [(-2, 1, 1). 


6.2.1. O que fizemos neste exemplo com uma matriz A de Ro 
de ser generalizado. Seja A uma matriz de ordem n. Quais o os a e 
e autovetores correspondentes de A? São exatamente aque É que as E Eu 
equação Av = Av ou Av = (Av ou ainda (A - Aly = O. Escreve 
equação explicitamente, temos 


Escrevendo esta equação explicitamente, temos 


0 
an -À åz s ain ps 0 
aa a22 -À seu n 2| -2 
é x 0 
ânı Im ada ânn A n 
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Chamemos de B a primeira matriz acima. Então B - v = 0. Se detB + 0, sa- 


bemos que o posto da matriz B é n e portanto o sistema de equações lineares 
homogêneo indicado acima tem uma única solução. Ora, como x, =x, =... = 
=Xy = 0 (ou v = 0) sempre é solução de um sistema homogêneo, então esta 
única solução seria a nula. Assim, a única maneira de encontrarmos autoveto- 
res v (soluções não nulas da equação acima) é termos detB = 0, ou seja, 


det(A - AI) = 0. 


Impondo esta condição determinamos primeiramente os autovalores À que 
satisfazem a equação e depois os autovetores a eles associados. Observamos que 


an -À ssa Gin 
P(A) = det(A - AI) = det 
Im ha Im -À 


é um polinômio em À de grau n. 


P(A) = (am - À)... (ann - À) + termos de grau < n, e os autovalores 


procurados são as raízes deste polinômio. P(A) é chamado polinômio caracterís- 
tico da matriz A. 


Consideremos mais alguns exemplos para fixar melhor o processo envol- 


vido no cálculo de autovalores e autovetores através do polinômio caracterís- 
tico. 


6.2.2 Exemplos 


Exemplo 1: 


det(A - M) = 


| 
(~w 
o 
— 
i 
“ 
1 
— 4 
>» 
to 
i A 
> 
Lo 14 


(3-A) (2-A) +4 
=)? +À- 2 = PQ). 


PA)=0 =>=@A-1)A+2)=0 ou À=1 ou à=-2 


Então os autovalores de A são 1 e -2. Procuramos agora os autovetores asso- 
ciados. 


Biblioteca de S 
Ciência & Tecnolôgia 


188 ÁLGEBRA LINEAR 


i) 


ii) 


A=1 
Temos 
-3 4||x “1]* 
-1 2j] dy 
Logo 
-3x + 4y i _ |x -4x + 4y =0 
-x + 2y y -x+ y=0 


Então, temos que x = y. 
Portanto os autovetores associados a À = 1 são os vetores V = (x, x), 
x + O. 


A = -2. 


Então 


-x+ 4y=0 E 
nd ou x = 4y. 


Os autovetores correspondentes ao autovalor À = -2 são da forma 


v = (4y, y), y + 0 (ou v = (œ, 72) 


Da 
x = 4y 


Figura 6.2.1 


As retas acima são “invariantes” em relação a esta aplicação. 
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Exemplo 2: 


sp 4 
E 


P(A) = det(A - AD = det V3-à al 
Lo V3-A 

=(V3 -A +41 

=N -2V3 A +4. 
P(A) = O não admite raiz real (A = -4), logo a matriz A não admite autova- 
lores (nem autovetores). Isto significa que a transformação dada pela matriz A 
não preserva a direção de nenhum vetor. Ta (v) + Av, v Æ 0. 
Geometricamente, como 


.|2 0|| cos30º -sen30° 
O 2) |sen30º  cos30° |, 
a transformação Tą dada pela matriz A é uma rotação de 30º composta com uma 


dilatação. 


Ta, y) = (V3 x - y, x + V3 y) 
TU, 0) = (V3, 1) e TA, 1) = (1, V3 ). 


T{0, 1) 


T(1,0) 


Figura 6.2.2 
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6.2.3 Observação 

Observe que se estivéssemos trabalhando com um espaço vetorial complexo 
(isto é, os escalares são números complexos), o polinômio característico P(A) = 
= A? - 2/3 A + 4 do exemplo anterior teria as raízes À = V3+iek= 
= V3 - i Os autovetores encontrados, da mesma maneira que no caso real, 
são do tipo (x, -ix) e (x, ix) respectivamente. Assim, toda aplicação linear so- 
bre espaços vetoriais complexos sempre admite autovalores, uma vez que seu 
polinômio característico sempre admite raiz. Neste caso não se tem à visão 
geométrica de autovetor como vetor que tem sua direção preservada pelo ope- 
rador. Veremos no Capítulo 12 que autovalores e autovetores complexos apa- 
recem na resolução de um sistema de equações diferenciais, provindo de uma 
situação real. 


6.2.4 Vamos apresentar agora duas matrizes que têm o mesmo polinômio 
característico e, portanto, os mesmos autovalores, porém, com autovetores di- 
ferentes. Além disso, vamos resolver os sistemas de equações lineares que nos 
dão os autovetores usando matrizes escalonadas. 


6.2.5 Exemplos 


Exemplo 1: 
3 0 -4 3-A 0 -4 
A=}0 3 5| e A-M=| O 3-A 5 
o 0 -l 0 0 -1 -À 


Então, P(A) = det(A - AD = (3 - A}? (1 - A). 
Os autovalores de A são A = 3 e M =. 
i) Autovetores associados a À; = 3 


3 0 -4 x x 
0 3 Sllyl=3]» 
0 0-1 z A 
3x -4&z=3x -4z = 0 
3y + 5z = 3y > 5z=0 
-Z = 3z -4z = 0 
Matriz ampliada do sistema: 
0 0 -4 0 0 0 1 0 O 010 
o 0 5 0|-|0 0 5s 0|-|0 0 0 0 
0 0 -4 0 0 0 -4 0 0 0 0 0 
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A solução é:z=0 e x,y quaisquer. 
Portanto os autovetores são do tipo v = (e, y, 0) 


ii) Autovetores associados a À, = -1. 
3 0 -4 x x 3x -4&z= -x 
0 3 5 y = -1 y ==> 3y a 5z= -Y 
O 0 -I z Zz -z= -Z 
4x cem 4z = 0 
= 4y = 5z = 0 
0=0 
Matriz ampliada do sistema: 
4 0 -4 0 1 0 -1 0 1 0 -1 
0 4 -5 Oj~]O0 4 -5 Qd a -5 
00 0 0 00 00 O 
o 0 O 0 
x - z=0 
===> y -3z =0 
Oz = 0 
Solução: x = z, y 5 z, z qualquer. 
Os autovetores são do tipo v = (2,5 Zz, z), z Æ 0. 
Exemplo 2: 
3 -3 -4 
A=IO 3 5 
0 0 -1 
3-A -3 -4 
PA) = (0) 3-À 5 = (3 -AP (1-2). 
0 0 -1 -À 


Observe que este polinômio é o mesmo que o do exemplo anterior. Então os 
autovalores são A =3 e M =-1. 
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6.2.6 Nesta secção definimos polinômio característico de uma matriz, 


i) Para à; =3 
ou seja, da transformação linear T: R” > R?” à ela associada como em 6.1.6. 
3 3 -4 Ix 3 3x - 3y - 4z = 3x Podemos estender este conceito para qualquer transformação linear 
o 3 slilyl=3» 3y + 5z = 3y T: V > V, partindo do seguinte argumento. 
0 0 -1 E f ra Seja $ uma base de V, então temos as equivalências: 
Tv = 
-3y - 42 =0 B Mra 
= Sz = 0 [T] Lv), = ALV] => 
RE mf- Ji 
i A = 
0 -3 -4 0 1 40 1 50 det (TÉ - N) = 0 
0.00 5 e a E Oi ; ; 
o 0 4 0 > SO SE SO Observamos que a última condição é dada por P(A) = O onde P(A) é o poli- 
0 0 -4 z nômio característico da matriz [7]Ê conforme o conceito dado em 6.2.1. 
0 100 Neste caso P(A) também será chamado polinômio característico da transforma- 
~lo o ı 0 ção T e suas raízes serão os autovalores de T. O fator fundamental nesta defi- 
00 0 0 nição é sua independência da base ß escolhida. 


De fato, seja « uma outra base de Ve A = [Th . Então (veja 5.4.10), 


y =0, z = 0, x qualquer. 
Os autovetores são do tipo v = (x, 0,0), x + 0. 


ii) Para À = -l 


det (LTL - M) = det (ALTA? -MIAT) = det [ACT -AD + A7] 


= det (4) det (TÉ - A) - det (A!) = det AT-M) = PA). 


3x - 3y - 4z = -x 4x -3y - 42 =0 
3y + 5z = -y => 4y + 5z=0 
-Z = -Z 0=0 
6.2.7 Exemplos 
4 -3 4 0 1 -4 1 0 | + 1 0 Exemplo 1: Seja T:R? >R? dada por T(x, y) =(-3x + 4y, -x + 2y). 
0 4 5 0j~ (è) 4 5 Bi 5 cs Procuremos seus autovalores e autovetores. Notemos que se œ é a base canô 
0 0 0 OQ 0 000 0 l 4 0 nica de R? 
0 o 0 0 4 
[T] = R | e, portanto, 
p ast- M EN $ 
16 
Sal 5 g | e vemos que podemos dar o polinômio característico de T como P(A) = det ([ TŠ - MM. 
FY Você pode agora concluir o exemplo copiando de 6.2.2 — Exemplo 1. 
0 0 0 
Exemplo 2: Seja P, o espaço vetorial dos polinômios reais de grau menor 
Er ye BETE qualquer. ou iguala um e seja T:P, >P, a transformação linear que leva o polinômio 
16 z l+x em 5+2x e o polinômio 4t x em -2 » (4+ x). Note que w = itxe 


w= 4 +x são vetores LI, e portanto formam uma base æ de P, e portanto 


Os autovetores são do tipo v = C Z; -5 z,2), 72 + 0. 
T está bem definida. Observe ainda que T(w)) = w, + w, e T(wo) = -2wa. 
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a [l 0 
Portanto Ta = | A : 
O polinômio característico é P(A) = (1 - A)(-2 - A) e os autovalores serão, por- 
tanto, A, = 1 e À = -2. Calculemos os autovetores associados: 


i) [TI “Ih = Iv] © que implica [va = [5 ja ER 


i Tg = 2lvl, o que implica {v}, = Hi e 


Assim, os autovetores associados a A; = 1 são da forma 

V = aW; t 3aw, = 132 + 4x, Va 

Ainda, os autovetores associados a A, = -2 são da forma 
v=0.w + bw, = 4b + bx 


6.2.8 Vamos aproveitar os exemplos de 6.2.5 para introduzir o conceito 
de multiplicidade de um autovalor. Chamamos de multiplicidade algébrica de 
um autovalor a quantidade de vezes que ele aparece como raiz do polinômio 
característico. No Exemplo 1 de 6.2.5 o autovalor à; = 3 tem multiplicidade 
algébrica igual a 2. (Ou ainda, 3 é uma raiz dupla do polinômio característico.) 


No Exemplo 2 o autovalor A, = 3 tem multiplicidade algébrica 2. 

Observe que no Exemplo 1 encontramos para o autovalor À, = 3 autove- 
tores do tipo v = (x, y, 0). Note que ((x, y, 0) E€ R?; x,y ER} = 
= {x(1, 0, 0) + (0,1, 0):x, y E R} = [(1,0,0), (0, 1, 0)] e portanto a 
dimensão deste subespaço associado ao autovalor A, = 3 é 2 (dois vetores LI). 
Neste caso dizemos que a multiplicidade geométrica de A, = 3 é 2. Mais pre- 
cisamente, a multiplicidade geométrica de um autovalor À é a dimensão do 
subespaço V, de autovetores associados a A. No Exemplo 2, o auto- 
valor A = 3 tem multiplicidade geométrica 1, visto que a dimensão de 
((x,0,0);x E R} = {x(1, 0, 0); x E€ R} = [(1,0,0)] é 1. Observe ainda 
que se a multiplicidade algébrica de um autovalor for 1, a multiplicidade geo- 
métrica será necessariamente igual a 1. 


6.3 EXERCICIOS 


1. Seja T:R? >R? 
Ce, yje W, 2y). 


Mostre que À = 2 é um autovalor de T e vetores da forma (x, 2x) são os 
autovetores correspondentes. 


Autovalores e Autovetores 195 


Ache os autovalores e autovetores correspondentes das transformações linea- 
res dadas: 


2. T:R? >R? tal que T(x, y) - (2y, x) 

3. T:R? >R? tal que Tx, y) = (x+y, 2x + y) 

4. T:R? >R? tal que (x, y, z)> (x +y, x-y +2z, 2x +y-z) 
5. T:Pı > Pa tal que T(ax? + bx + c) =ax? + cx +b 


6. T:Mı >M, tal que AM A' (Isto é, T é a transformação que leva uma 
matriz na sua transposta.) 


7. T:R? > R° tal que Ti, y, z, w) = (x, xtyxtytz,x+ytztw) 


8. Encontre a transformação linear T: R? » R?, tal que T tenha autovalores 
-2 e 3 associados aos autovetores (3y, y) e (-2y, y) respectivamente. 


Ache os autovalores e autovetores correspondentes das matrizes: 


l 2 
sai 7] 
nl 
0.4! 1] 


01 
1 2/3 Is. A=| 0 0 1 
ILA=|0 ł 2 -1 0 0 
O 01 
1 3 3 
3- aJ ad mal o 4 0 
12.A =| 0 3 5 -3 3 | 
0 0 1 
-1 -4 14 
1 0 2 mal? -7 14 
13.A=| -1 0/1 2 -4 ll 
L 1 2 
2 0 10 
1 1 2 18. A = 0 2 0/1 
I4.A=|1 2 1 12 0 3 0 
Ze d I O -1 0 0 
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20. 


21. 


22. 


23. 


24. 


25. 


26. 


-1 -2 0 
. Seja A= |O -1 1 j. Quais são os autovalores e autovetores de A de 
1 o 0 


um espaço vetorial: 
a) Real b) Complexo 


Se À é autovalor da transformação linear T:V> Ve v é um autovetor asso- 

ciado a ele, mostre que 

a) kv é outro autovetor associado a À se k + 0. 

b) O conjunto formado pelos autovetores associados a À e O vetor nulo é 
subespaço de V. 


Suponha que A, e À sejam autovalores distintos e diferentes de zero de 
T:R? > R?. Mostre que 
a) Os autovetores vı € v} correspondentes são LI. 


b) Tvi) e T(v,) são LI. 


à 0 2 
Seja A = f a 


a) Ache os autovalores de A e de A™'. 
b) Quais são os autovetores correspondentes? 


Suponha que À seja autovalor de T:V -> V com autovetor v e a um número 
não nulo. Ache os autovalores e autovetores de aT. 


Suponha que v E V seja autovetor de T:V> Ve S:V> V, ao mesmo 
tempo com autovalores A, e A, respectivamente. Ache autovetores e auto- 


valores de 
a)S+T b) SOT. 


Seja T: V > V linear 

a) Se À = O é autovalor de T, mostre que T não é injetora. 

b) A recíproca é verdadeira? Ou seja, se T não é injetora, À = O é autova- 
lor de T? 


l | 
Sejam A =|/0 -1l lj] e B=|0 
0 0 


matrizes inversíveis. 
a) Calcule AB e BA e observe que estes produtos são distintos. 
b) Encontre os autovalores de AB e os de BA. O que você observa? 


22. 


23. 
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c) Encontre os autovetores de AB e os de BA. O que você nota? 

d) Motivado pelos itens anteriores, mostre que: se A e B são matrizes in- 
versíveis de mesma ordem, os autovalores de AB e BA são os mesmos. 
Mostre mais ainda: se A é um autovalor de AB com autovetor v, então 
A, é autovalor de BA com autovetor Bv, Da mesma forma, se À é um 
autovalor de BA com autovetor w, então À, é autovalor de AB com 
autovetor Aw. 


6.3.1 Respostas 


AM = 1+VSwm= GV) A = 1-VZw = (4-2) 
.X=l,v=ax +bx+tb 

.A = 1, v = (0, 0, 0, w) 

To, y) = C6, x +y) 

„A= l, v =@, 0; M = -1, v = (y, y) 

. A= 1, v = (x, 0, 0) 


A = l, v = (7, y, 0); A =-1,v2 = (x, 2x, x); Às = 3, Y3 = (x, 0, x) 


=4,vi =0 -z, y, z); o) =-2,Y = (x, 0, x) ou A; =4, 
Vi = (py, J. 0); À2 = 4, Va =(-z, 0, z); As = -2, Ya = (x, 0, x) 


LAr = -3, vi = (2y - 7z, y, Z); M =9 Y2 = Œ, x, x) 


A = 1, vi = (0, y, 0, -y); M^ = -1, Y2 = (x, 0, -2x, 0); às = 6, 


va = (x, 0, 4x, 0) 


a) à = -2, v = (2x, x, -x) 


b) A = -2, Vi = (2x, X, -x); LS) = i, v = [(-1 + Ñy, 7}. (l + dy); 
Às -i, Y3 = ((-1 -Dy, Y, a K dy] 


a) Os de A são -l e 2; os de At, es. 
b} Os de B são (-2y, y) € (x, 2x); os de A`! , (-2y, y) e (x, x) 


Autovalor «A com autovetor v. 
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25. a) Como À = O é autovalor, existe v-+ O tal que Tv = 0 +v = 0. 
Então TO = 0 e Tv = 0. Portanto, T não é injetora. 


b) Como T não é injetora, existe v + w tal que Ty = Tw. 
Então Tv - Tw = Mv -w)=0=0-(v - w). Portanto, O é autovalor 


de T com autovetor v - w. 


26. b) São iguais, Ai = l, À2 = -2, As =-3 
5 
c) São diferentes. vı = (x, 0, 0), vz = G y, y, 0}, vs = ($ z, 2,2) 


Leituras Sugeridas e Referências 


1 Herstein, I. N.; Tópicos de Algebra, Editora Polígono, São Paulo, 1970. 
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DIAGONALIZAÇÃO DE 
OPERADORES 


No Capítulo 5 foram introduzidas as aplicações lineares e as matrizes a elas 
associadas. Nosso objetivo neste capítulo será encontrar uma base do espaço 
vetorial na qual a matriz de um determinado operador linear seja a mais sim- 
ples possível. É fácil deduzir as conveniências práticas de se trabalhar com os 
operadores, usando tais matrizes. Por muitos motivos, como você verá, a me- 
lhor situação possível é aquela em que conseguimos uma matriz diagonal asso- 
ciada a um operador. 


7.1 BASE DE AUTOVETORES 

Dado um operador linear T: V > V, nosso objetivo é conseguir uma base É de 
V na qual a matriz do operador nesta base (TIS Seja uma matriz diagonal, 
que é a forma mais simples possível de se representar um operador. Observe- 


mos inicialmente a seguinte propriedade dos autovetores, 


7.1.1 Teorema: Autovetores associados a autovalores distintos são linear- 


mente independentes. 
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Prova: (Este teorema será provado para O caso de dois autovalores distintos.) 
Sejam A,, àz autovalores, À Æ À2, € Vi, V2 autovetores associados aos 

autovalores A e A, respectivamente. Provaremos que vi € V2 são LI. 

Seja aV; + &2Y2 = 0. Apliquemos a esta equação a transformação T - Aqf. 


Usando a linearidade de T e lembrando que T(v;) = Av; € Ivi = v; para i = 
= 1, 2, resulta 


ad - Avi ta - My =0 
ou 
di - Av, =0 


Como v; #0 e A Æ àz, determinamos que q, = 0. 
Voltando à equação original e aplicando T - Ai J, temos 


aA -AW +a - Adv =0 
ou 


aÀ - AWV = 0 


Isto é, a} = O. Portanto v; e v, são LI. 


A demonstração deste teorema para O caso geral em que temos Ay, Az, = 
à, autovalores distintos é feita de maneira análoga. Partimos da igualdade 


avi tay +.. tam =0 
e aplicamos os operadores T - A para mostrar que 4; = 43 =... = = 0. 
Por exemplo, para mostrarmos que a, = 0, aplicamos sucessivamente à equação 


original os operadores: 
T-I, T -l, T -l T- l, n T-M 


Uma conseqüência deste teorema que nos interessará particularmente é 
dada a seguir. 


7.1.2 Corolário: Se V é um espaço vetorial de dimensão n e TiV>Vé 
um operador linear que possui n autovalores distintos, então V possui uma 
base cujos vetores são todos autovetores de T. 

Em outras palavras, se conseguirmos encontrar tantos autovalores distintos 


quanto for a dimensão do espaço, podemos garantir a existência de uma base 
de autovetores. 


7.1.3 Exemplos 


Exemplo 1: Seja T:R? >R? a transformação linear definida por 
Tix, y) = (-3x + 4y, -x + 2y) cuja matriz em relação à base canônica & é 
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[T] - -3 4 
a -1 2 
(Veja o Exemplo 1 de 6.2.2.) 
Queremos encontrar uma base 8 de autovetores, se possível, e ainda 
observar de que tipo é a matriz TE. Desde que Ài = 1 e As = -2, e portanto 


A & àz, podemos garantir, pelo corolário anterior, a existência de uma base 
de autovetores. 


De fato, dois autovetores associados a À, e A, são vı = (1, 1) e v2 = 
= (4, 1) respectivamente, os quais formam uma base de R?. Isto é, o espaço 
admite uma base 8 = (vi, vz} formada por autovetores de T. 


Calculemos agora irf. Como Mvi) = Iv; = Iv, + Ov, e T(vz2) = -2v: = 


= Ov, = 2v3, 
ik= lo A 


l Observe que a matriz de T em relação à base de autovetores é uma ma- 
triz diagonal. 


. Seia T- R3 3 PEA 
Exemplo 2: Seja T:R? > Rº uma transformação linear cuja matriz em 
relação à base canônica q é 


3 0 
trio = 0 3 5 
0 0 


PON) = det(iT) - A) = G -AP (1-1. 


Os autovalores são À = 3 e A, = -1. Associado a À = 3 temos auto- 
vetores do tipo (x, y, 0). 
Portanto obtemos dois autovetores LI. 


Vi = (l, 0, 0) 


vo = (0, 1, 0) 


Associado a àz = -1 temos um autovetor LI, u = (4, -5, 4). 
Então 8 = (vi, v2, u} é uma base de R? constituída de autovetores de T e 


300 
[TH = 03 0 
o 0 1 


202 ÁLGEBRA LINEAR 


i é uma 
Observe que em relação a esta base de autovetores, a matriz de T 


matriz diagonal. 


É claro que as matrizes diagonais irf que foram obtidas nos Exemplos 


mação linear qualquer 


ã i . Dada uma transfor 
1 e 2 não o foram por acaso des Ros Ra 


T:V >V, se conseguirmos uma base B = [Vis o Yn 
de T, então, como 


T(vi) = Avi + Ovo +... + Ovn 
T(v2) = 0v + AY t- + Ovn 


T(vn) = Ovi + Ovo +- + AnYns 


á iz di ementos da diagonal princi- 
a matriz ir$ será uma matriz diagonal onde os el 


pal são os autovalores Aj, isto é, 


m 0 cata TD 
0 

B Moo 
[Mg - . . É 
de O ab A 


os À; distintos (veja O Exemplo 2). 


ã i i te 
recisamos ter necessariamen 
H iagonal tantas vezes quantas forem Os 


Na verdade, um autovalor aparecerá na d 
autovetores LI a ele associados. 


i ue 
Por outro lado, se Y = {ui; = uņ„} é uma base de V tal q 


a 0 . 0 
0 az Ses 0 
Y - 
[ri = | 
o 9 An 


es 
un são necessariamente autovetores de T com autovalor 


e ui, i 
aT da definição de [T]; temos: 


y Y 
di, =~ an respectivamente. De fato, 4 
T(u,)= au, + Ou, t... + Qun = 21/41 


T(un) = Ou, + Ou, +. + aU, = nUn 


es recon 
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Concluímos então que um operador T: V > V admite uma base 8 em re- 
lação à qual sua matriz [T h é diagonal se, e somente se essa base B for forma- 


da por autovetores de T. É este o motivo da definição que se segue. 


7.1.4 Definição: Seja T: V > V um operador linear. Dizemos que T é um 
operador diagonalizável se existe uma base de V cujos elementos são autoveto- 
res de T. 


Os operadores dos Exemplos 1 e 2 são, portanto, diagonalizáveis. Vamos 
dar a seguir um exemplo de um operador não diagonalijzável. 


Exemplo: Seja T:R? >» Rº a transformação linear cuja matriz em relação 
à base canônica q é 


3 E). 84 
IT =ļo0 3 5 
0 0 -i 


Como P(A) = (3 - A)? (-1 - A), os autovalores são A = 3e A, =-1. 
Associado a A, = 3 conseguimos apenas um autovetor LI, por exemplo, v = 
= (1,0, 0). Associado a À = -l temos o autovetor LI, u = (-1, -20, 16). 
Neste caso, temos apenas dois autovetores LI para T, e portanto não existe 
uma base de R? constituída só de autovetores. Isto significa que em nenhuma 
base a matriz de T é uma matriz diagonal, ou seja, T não é diagonalizável. 


7.1.5 Aplicação ao Estudo de Vibrações 


Consideremos dois corpos de dimensões desprezíveis e massas Mı e M2, res- 
pectivamente, presos a 3 molas de constantes elásticas k}, k, e k; conforme 
mostra a Figura 7.1.1. Supondo que o movimento só ocorra na horizontal, 
como podemos estudar a posição dos dois corpos em função do tempo a 
partir de uma posição diferente da de equilíbrio? 


posição j í 
de equilíbrio 


posição em 
um instante t 


t Figura 7.1.1 i 
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Chamando de x e y os deslocamentos (horizontais) em relação à posição 
de equilíbrio de m, e m,, e lembrando que o produto da massa pela acelera- 
ção é igual à força aplicada e que a força que uma mola exerce (em primeira 
aproximação) é igual menos o produto da sua constante de elasticidade pelo 
deslocamento em relação à posição de equilíbrio, podemos escrever (onde 
X e ï indicam a derivada segunda em relação ao tempo): 


m,X = -k, x + ki - x) 


my = -k(x - x) + kay 
ou, em termos de matriz: 
+ 
% kit ka ka k 
= mi m1 
E e k2 kat k3 
y ma my 


Devemos achar então como x e y variam em função do tempo, ou seja, 
resolver o sistema de equações diferenciais anterior. Observe que uma das difi- 
culdades de resolver o sistema é o fato dele ser acoplado, isto é, em ambas as 
equações aparecem ambas as variáveis. Uma possível tentativa de resolver o 
problema é a de tentar desacoplar as equações, isto é, obter duas novas equa- 
ções, equivalentes às anteriores, de tal forma que em cada uma delas apareça 
apenas uma incógnita. Resolvemos, então, cada uma destas equações e volta- 
mos para as incógnitas originais. (No Capítulo 12 você poderá ver outros mé- 
todos para tentar resolver tais sistemas.) 

Observe que em uma situação deste tipo teríamos um sistema da forma: 


ou, na forma matricial 


Isto nos dá a pista para tentar desacoplar o sistema original: devemos 
diagonalizar (se possível) a matriz do sistema original. 


Façamos isto no caso particular em que m, = m, = mM e ki = k= k; =k. 


As equações tornam-se então (na forma matricial} 


xX Tak x 
z m m 
C] k -2 

7 m m| |? 
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Podemos pensar na matriz 


-2k k 
A m m 

ko -2k 

m m 


co i 
n a matriz de um operador linear de R? em R? em relação à base canò 
aë de 
r xey como as componentes de um vetor em relação à base canônica 
entemos diagonalizar tal operador: | 


2k oiy ek 

x m m 
PQ) = det | ” Ea hth x) 
peste e e m m 

m m 


Portanto os autovalores são A = = e à= 
m 


eles pis =(1,1)e v, = (1,-1), respectivamente. Chamando a a base canô 
nica, 8 = {v;, »3} a base composta por tais autovetores e 


peio 


be = j temos: 


z 
o afn (IE) A ug 


onde 


] I 
ng = [5 1] 


Além disso, por simples derivação: 


p 


Substituindo estes resultados na equação original vem: 


"etja ue- E] 
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ai = 
X| E X 
#|- up zanih 
i FVE X 
|” 
y| lo 2| lY 
Portanto m 
Tany 
m 
y- k 
m 


Podemos resolver separadamente cada uma dessas equações obtendo 


k 

X = nnl (Es + 81) 
3k 

Y = Asen ( a, 


que são os chamados modos normais de vibração do sistema. 


Voltando para as variáveis originais temos 


k /3k 

nal JE t+) + assen( E es) 
k /3k 

pesa Eit 00) - aasal, CE ai) 


7.2 POLINOMIO MINIMAL 


X 


F 


Nos exemplos anteriores nós mostramos que 
nalizáveis, exibindo uma base de autovetores, 
base. Em casos de espaços vetoriais de baixa 
é este o procedimento conveniente. Entretanto, 


principalmente no caso de espaços vetoriais 
são longos — em saber se um operador linear é diagonalizável ou não, sem 


calcular os autovetores. Já sabemos a resposta para este problema na seguinte 
situação: se dim V = n e o operador linear T tem n autovalores distintos, 

então ele é diagonalizável (veja 7.1.2). 
aspecto de um polinômio que cha 
T. Para isto, vamos introduzir a no 


podemos estar interessados — 


ção de polinômios calculados em matrizes. 


os operadores eram ou não diago- 
ou mostrando a inexistência desta 
dimensão, como os dos exemplos, 


de dimensão alta, onde os cálculos 


No caso geral, a resposta está ligada ao 
maremos de polinômio minimal do operador 
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7.2.1 Definição: Seja p(x) = n 
l : =X" +t. taxt inômi 
uma matriz quadrada. Então p(A) = matriz a a ci 


MA) =a A" +... +a,A + agl. 


Quando p(A) = 0, dizemos que o polinômio anula a matriz A 


Exemplo: Sejam p(x) = x? - 9 e q(x) = 2x + 3, 


: aa) = 2/75 ei IBE J 


Então, p(x) anula A e q(x) não anula A. 


7.2.2 Definição: Seja A uma matriz quadrada. O inômi ini 
RR q . O polinômio minimal de A 


k-1 


mO) = xt +ap ax +. + ao 


tal que 


à) m(A) = 0, isto é, m(x) anula a matriz A. 
ii) m(x) é o polinômio de menor grau entre aqueles que anulam A. 


e que o coeficiente do termo x* do polinômio minimal é 1 
(ak = 1). 


A seguir apresentaremos alguns resultados envolvendo polinômio minimal 
que vão nos levar a descobrir um procedimento que nos possibilite determinar 
se um operador linear é diagonalizável ou não, sem calcular os autovetores. As 
demonstrações desses resultados são em geral muito elaboradas abrangendo 
outros conceitos como o de decomposição de um espaço vetorial em soma di 
reta de subespaços, e que fogem aos objetivos deste texto!. ad 


7.2.3 Teorema: Sejam 7:V >V um operador linear e a uma base qual- 
quer de V de dimensão n. Então T é diagonalizável se, e somente se o polinô- 
mio minimal de Ta é da forma 


1 ; ; 
Você pode encontrá-las, por exemplo. em Hoffman, K. e Kunze, R. Álgebra Linear. Editora 
R. _ Editor 


Polígono. São Paulo, 1971. 
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mx) = (x - `i) (x - Ao). lx - Ar) 


com Ài, Àz; = Ap distintos. 


O nosso problema que consiste em determinar se T é diagonalizável 
reduz-se então ao de saber achar o polinômio minimal de T. Os teoremas que 
nos ajudarão a fazer isto são: 


7.2.4 Teorema de Cayley-Hamilton: Seja 7:V > V um operador linear, œ 
uma base de V e p(x) o polinômio característico de T. Então 


pUTIo = 0 


Isto significa que o polinômio característico é um candidato ao polinômio 
minimal porque ele satisfaz a condição i) da definição 7.22. 


Exemplo: (Demonstração do teorema no caso 2x2.) 


aera 


Então o polinômio característico é 


pA) = (f; A - alo J = (a -\) (d - A) - be. 
casser JE Die TE) 
10 0 0 
E belo ] E Ê | 


7.2.5 Teorema: As raízes do polinômio minimal são as mesmas raízes 
(distintas) do polinômio característico. 


Estes dois teoremas juntos nos dizem como achar o polinômio minimal 
de um operador linear T:V > V. O polinômio minimal deve ser de grau menor 
ou no máximo igual ao do polinômio característico (7.2.4) e ainda deve ter as 
mesmas raízes (7.2.5). 

Por exemplo, seja 7:V > V um operador linear e a uma base de V. Su- 


ponhamos que o polinômio característico de T seja PO) API +5) 


Então o seu polinômio minimal será um dos polinômios: 
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pO)=(x-D(x-1D)(x+5) 
p(x) = œx -3 (x-D)(x+5) 
pao) = (x - 3) (x - 1} (x + 5) 
pax) = (œx -3)& -1P œ+ 5) 
pe) =(x-3 œ - 1P @ + 5) 
pe) = œ - 3} (x -1P œ +5). 


Como o polinômio minimal é o de menor grau que anula Te verifica- 
mos primeiramente se pátrio) = 0. Em caso afirmativo, p;(x) será o polinô- 
mio minimal. Se pi (ITIS) * 0, testamos patTIo e assim sucessivamente. Na 


pior das hipóteses o polinômio minimal será p(A) isto é, o polinômio caracte- 
rístico. 

Volte agora ao teorema 7.2.3. O operador acima só será diagonalizável se 
o seu polinômio minimal for p;(x). Esse argumento nos motiva a reinterpretar 
o teorema 7.2.3. 


7.2.6 Teorema: Sejam Ài, À», ..., Ap OS autovalores distintos de um ope- 
rador linear T. Então T será diagonalizável se, e somente se o polinômio 
O - A) - A). (e - Àr) 
anular a matriz de T. 


Exemplo: O operador linear T:R > Rº definido por T(x, y, z, f) = 
= (3x - 4z, 3y + 5z, -z, -t) é diagonalizável? 

Resolução: Seja a = {(1, 0, 0, 0), (0, 1, 0, 0), (0, O, 2, ©), (0, O, 0, 1)) 
a base canônica. Então a matriz 


3 0 -4 0 

Q 0 3 5 0 
Maio o -1 0 
00 0 1 


Calculemos o polinômio característico 
pO) = det(T - A) = 6 - N? (1-0. 


Os autovalores são à; = 3 e A = -l, ambos com multiplicidade 2. Então, os 
condidatos para o polinômio minimal são 


pix) =œ -3)& +1) 
p(x) = (x -37 (x +1) 
p36) = œ - 3) (e + 1) 
Pal) E fx E 3)? (x t 1)? Biblioteca dè 


Ciência & Teeni 
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Notamos que pi (TIS) = 0 e é, dentre os candidatos, o de menor grau. 


Então 

pæ) = - 3) œ +1) 
é o polinômio minimal. Portanto, T é diagonalizável, isto é, existe uma base 8 
de autovetores e nesta base 


0 
0 
-1 
0 


Soo w 
Dowo 
=- 0O o 


* 7.3 DIAGONALIZAÇÃO SIMULTÂNEA DE DOIS OPERADORES 


Suponhamos que sejam dados Tı :V> V e Ta :V > V operadores lineares, am- 
bos diagonalizáveis. Isto significa que existem bases a; € q de V tais que 


[T la e [7> Ip são diagonais. No entanto, não podemos garantir que q, = Q2, 


isto é, não podemos garantir sempre que existe uma mesma base a de V em 
relação à qual as matrizes de T, e T, admitem o mesmo conjunto de autove- 
tores LI. Em que situação vale tal relação entre Tı e Ta? Mostrase? que dados 
T, e T, operadores diagonalizáveis, então T, e T, são simultaneamente diago- 
nalizáveis se e somente se T) e T} comutam (TOT = ToT,). 

Na prática, dados T, e T3, tomamos uma base 8 qualquer de V e verifi- 


camos se T, e T, são diagonalizáveis. Se isto acontecer e, além disto, |7, KIT: É = 
= rÉ IT: É, então podemos concluir que T, e T; são simultaneamente dia- 
gonalizáveis. 

Exemplo: Sejam Ti, T3 :R? > R? operadores lineares cujas matrizes em 


relação à base canônica são respectivamente 


0 


[7] = 0 
4 


o ujn vfo 
o aja afro 


ol e [7,]=|- 
2 


Calculando os autovalores de T}, temos A = 1, A, =2€ As = 2. Observamos 
que o polinômio m(x) = (x - 1) (x - 2) anula [T], e portanto T, é diagonali- 


2veja, por exemplo, Hoffman, K. e Kunze, R. op. cit. pág. 190. 
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zável (veja 7.2.6). Calculando os autovalores de T,, temos A = -1, à2 =3e 
As = 4. Como eles são distintos, T2 é diagonalizável (veja 7.1.2). Além disso, 


115 70 
5 zs 0 

IT] [Ta] = (70 10 -= IT] IT 
Lo [T2] (Ti) 
0 0 8 


Portanto, T, e T} são simultaneamente diagonalizáveis. 
Poderíamos ter observado isto calculando os autovetores. 
Para T;: com À, = 1 obtemos os autovetores (x, -2x, 0) e com àz = 2, os 
autovetores (-2», y, Z). 
Para T3: À = -l é associado ao autovetor (x, -2x, 0), A = 3 a (-2y, y, 0) e 
àa = 4 a (0,0, z). 


Então (1, -2, 0), (-2, 1, 0), (0, 0, 1) são simultaneamente autovetores LI de 
T, c Ta, e desse modo na base 8 formada por estes vetores 


Ow o 
AOOO 


l 
IT =| 0 
0 


ONO 


0 É 
ole InÊ=|o 
2 0 


7.4 FORMA DE JORDAN 


Já sabemos que nem todo operador é diagonalizável. Por exemplo, T:V > V, 
onde V é um espaço vetorial real de dimensão dois, cuja matriz em relação a 


uma base a é 
[o 0 1 
[Ta = É | 


a qual não é diagonalizável, pois o seu polinômio característico é À? + 1, que 
não possui raízes reais. Assim, este operador não possui autovetores, e portanto 
não possui autovalores. Entretanto, se o espaço vetorial V for complexo (isto 
é, se permitirmos que os escalares sejam números complexos quaisquer) e consi- 
derarmos a mesma matriz, O polinômio característico passará a ter duas raízes 
distintas, i e =i, e portanto o operador será diagonalizável. De fato, um autove- 
tor associado ao autovalor i é (1, Ò e um associado a -i é (1, -i). Se B for a 


i ; 0 
base destes autovetores, então rÉ = f B | Vemos assim que com relação 
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ao fato de um operador linear ser diagonalizável ou não, o conjunto dos esca- 
lares no qual trabalhamos desempenha um papel importante. 

Ainda assim, mesmo permitindo valores complexos, nem todo operador 
linear é diagonalizável. Por exemplo, seja T:V-» V, onde V é um espaço veto- 
rial complexo de dimensão 4 e 


[Th = 


So oOo- 
o-— oo 
“So 


0 
-1 
0 
0 


onde a é uma base de V. Então, o polinômio característico de T é p(N) = 
= (A -ÖA +i (A-1), e portanto seus autovalores são À = i, Àz = À, 
As = 1 (com multiplicidade 2). Não é possível, entretanto, encontrar dois auto- 
vetores LI (tente!) para Às = 1, e assim T não é diagonalizável. 

Porém, quando T: V > V for um operador linear não diagonalizável e V 
um espaço vetorial complexo, poderemos achar sempre uma base 8 de V, tal 


que (rg assuma uma forma especial, chamada forma de Jordan. Esta forma é 


obtida por blocos do tipo 


À; 0 
1 A; 
1 
Ai 
0 Il N 


ou [à;] colocados na diagonal. 


Exemplo: 
-2 010 0 00000 
1.210 0 00000 
0o o0 |-2 0] 00000 
o ol) 2:00 00 0 
o o © 0/2100 0 0 
o 0 0 0 E 
o o 0o 0 0 0i3 00 
o 0o o 0 0 Op 3 0 
0 0 0 0 0 0/0 13 
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A demonstração deste fato é um tópico especial que deve fazer parte de 
um estudo mais avançado de Algebra Linear. 


7.5 EXERCICIOS 


l. Entre os operadores dos exercícios 2 a 8 da secção 6.3 verifique quais são 
diagonalizáveis. 

2. Dizemos que uma matriz A 
nxn 

i P E o à i i 

Ta : R” > R” for diagonalizável, ou seja, A é diagonalizável se, e somente 

se A admitir n autovetores LI. Baseado nisto, verifique quais das matrizes 

dos Exercícios 9 a 18 da secção 6.3 são diagonalizáveis. 


é diagonalizável se seu operador associado 


3. Dada a matriz 


SON oO o 
ww ooo 


] 
2 
0 
0 


ooon 


a) A é diagonalizável (use a definição do exercício anterior). 
b) Encontre seu polinômio minimal. 


4. Seja A uma matriz 3 x 3 triangular superior, com todos os seus elementos 
acima da diagonal distintos e não nulos. 


a b c 
A-=|0 d e 
0o 0 f 


a) Quais são os autovalores e autovetores de A? 
b) Qual é o polinômio minimal de A? 


5. Para quais valores de a as matrizes abaixo são diagonalizáveis? 


e Pse 1] 


*Para detalhes consulte Lipschutz, S. Álgebra Linear, Mc Graw-Hill do Brasil Ltda., Rio de 
Janeiro. 1971: ou Hoffman. K. é Kunze. R. Algebra Linear, Editora Polígono, São Paulo. 
1971: ou Gelfond, I. M.: Lectures in Linear Algebra; Interscience Publishers, New York, 
1961. 
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6. Sejam T: R? > R? linear, a = ((1,0, 0), (0,1, 0), (0, 0, 1)), a base ca- 
nônica de R?, 8 = {(0, 1, 1), (0, -1, 1), (1,0, 1)J e 


E d 
Má=-|o -3 1 
0 0 -3 


a) Encontre o polinômio característico de T, os autovalores de T e os auto- 
vetores correspondentes. 


b) Ache Ir e o polinômio característico. Que observação você faz a este 
respeito? 
c) Encontre uma base y de Rº, se for possível, tal que Ir seja diagonal. 


. a) Sejam T:V >V um operador linear (V de dimensão finita) e a e 8 bases 
distintas de T. Mostre que 


det [TI& = det [my 


~ 


(Sugestão: veja a relação entre Iri? e rÉ no Capítulo 6). 


b) Se Anxm é diagonalizável, mostre que o determinante de A é o produ- 


to de seus autovalores. 
(Sugestão: considere Ty: R” > R”, observando que a matriz de TA na 


base canônica é exatamente A. Use então o resultado do item (a) consi- 
derando como a a base canônica e 8 a base de autovetores. 


so 


; 2 : á P 4 0 
Mostre que a matriz À = |; | é semelhante à matriz k q 


9. a) Mostre que um operador linear T (num espaço de dimensão finita) que 
comuta com qualquer operador linear diagonalizável é diagonalizável. 
b) Nas condições do item (a) mostre que na verdade T é um múltiplo esca- 
lar do operador identidade, isto é, existe um número 7 tal que T=r.f. 


10. Diz-se que um operador linear T: V >V é nilpotente se existir um número 
inteiro positivo n, tal que T” = O (isto é, TOTOTOTOTOTO ... oT(v) = 0) 
para todo v E V). 

a) Seja T nilpotente. Encontre seus autovalores. 
b) Encontre uma matriz A} x2 & O tal que TA :R? > R? seja nilpotente. 
c) Mostre que um operador linear nilpotente, não nulo, não é diagonalizável. 
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11. Diz-se que um operador linear T:V > V é idempotente se T? = T (isto é, 
se ToT(v) = T(v) para todo v € V). 
a) Seja T idempotente. Ache seus autovalores. 
b) Encontre uma matriz As x 2 £0tal que T, : R? > R? seja idempotente. 
c) Mostre que um operador linear idempotente é diagonalizável. 


3 0 0 
*12. Mostre que A =|0 2 -5 | não é diagonalizável. No entanto, se A repre- 
0 1.2 


sentar, numa certa base, um operador linear T:V > V, onde V é um espaço 
vetorial complexo, então T é diagonalizável. Verifique este fato ou, equiva- 
lentemente, que existe uma matriz com elementos complexos P} x3, inversi- 


vel, tal que 
3 0 0 
PL.A.P=I0 1; 0 
0 O i 
“13. Problema-pesquisa: |M a a a 
Seja a RR a a 
aapt SR a 
a a U M a 
a a a us. a M |nxn 


onde M e a + O são números reais. Mostre que 
a) Os autovalores de A são 
A=M-a com multiplicidade n - 1 
eu=M+(n-tl)a 
b) det A = (M - a}! . [M + (n - 1)a] 
(Este é um caso particular da situação estudada no artigo “sobre uma classe 
de matrizes cujo problema de autovalores é facilmente solucionável” de 
Odelar Leite Linhares, publicado na revista Ciência e Cultura (SBPC) volume 
29, número 8, de agosto de 1.977.) 


14. Utilize a forma diagonal para encontrar A” nos seguintes casos (n natural): 


0 7 6 
nas| J bA=|-1 4 0 
0202 


Você pode generalizar o seu procedimento para o caso de uma matriz qua- 


drada qualquer? Quais são as condições? 
Biblioteca de To 
Ciência & Tecnolôgi: 
| al 
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*15. Considere o sistema mecânico mostrado na figura abaixo 


Corpo 1 


corpo 2 Za ma 


Utilizando os procedimentos da secção 7.1.5 estude a vibração do sistema 
quando ele é tirado da posição de equilíbrio. Resolva completamente descre- 
vendo o comportamento do sistema no caso em que M, = 0,5 kg, m = 


= 0,5 kg, k = p, ka= 185 . Os deslocamentos iniciais dos corpos 
m 


1 e 2 são, respectivamente, 0,1 m para cima e 0,2 m para baixo. 
7.5.1 Respostas 
1. 63.2: 6.3.3; 6.3.4 e 6.3.8 são diagonalizáveis. 


2. 63.9: 6.3.10; 6.3.13; 6.3.14; 6.3.16 e 6.3.17 são diagonalizáveis. 
. a) Não 
b) p(x) = (2 - x? (3 - x) 


Qa 


S.a)a 1 
b)a=0 


a) pA)=(2-)X 3+ AŻ; A = 2, vi = &, 0, 0); `~ = -3, v2 = (0, y. 0) 


& 


b) 3 Do É 
ITÉ =|-1 -4 5). POA = -ANBA 
3 


1 | 


O polinômio característico é independente da base. 
c) Não existe. 
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10.0) A =0 
b)|jo O 
1 0 
c) Se T fosse diagonalizável, existiria uma base B tal que os autovalores esti- 
vessem na diagonal de ETA uma matriz diagonal. Mas os únicos autova- 


lores de T são O (veja a), e logo, Th = 0. É dizer, T seria nulo, o 


que não está de acordo com a hipótese. 
lH.a)h=0 ou 1 
b) |2 -I 
2 -I 
c) Como T’°v = Ty, (T? - TX = 0, ou seja, T? -T =0 
Seja p(x) = x? - x = x(x - 1). Então p(T) = O 
Como os autovalores de T são Oe 1,0 polinômio característico de T é 


da forma p(X) = (-))” (1 - A)”. Então p(x) é o polinômio minimal de 
T e como os fatores lineares são distintos, T é diagonalizável. 


14. a) Note que se temos uma matriz diagonal então b E | É E 
2 


0 
e autovetores respectivos (é possível fazer isto), bem como a matriz de 
mudança de base. Utilizando 5.4.10 pode-se escrever 


1 4/1 Ojji 4] 
afilho alb 4 
Portanto 
ane E a ofp p AA Ah o a 
Li 0 -2 l 1llo 2 1 ra 
ali olz] 4/7! 
Jo -2 l1 1 
“a -1+20*2 4.9n+t2 
“3149 4-2 


b) É similar ao anterior. 


AT ; l 
= | VAR Diagonalize, então, a matriz A calculando os autovalores 


ti 
— = 
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No caso geral o procedimento poderá ser o mesmo se A for uma matriz 


diagonalizável. Isto é, sendo B a forma diagonal de A, 


A = CBC! e então 
A” = (C+ B+ Cy = (CBC!) + (CBC!)... (CBC7?) = cB"c~’ 


n vezes 


usual para se obter a 


Assim temos um processo bem mais simples que O 
B uma matriz dia- 


potência de uma matriz diagonalizável, uma por ser 
gonal B” é calculada diretamente. 
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PRODUTO INTERNO 


8.1 INTRODUÇÃO 


Estaremos interessados neste capítulo em formalizar os conceitos de com- 
primento de um vetor e de ângulo entre dois vetores. Com isto teremos pro- 
cessos para que se possa “medir” num espaço vetorial, da mesma forma pela 
qual se mede no plano ou no espaço. E é a noção de medida que nos leva a 
precisar conceitos como o de aproximação, área, volume etc. 


Figura 8.1.1 
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Consideremos inicialmente o plano Rº, munido de um referencial carte- 
siano ortogonal (eixos perpendiculares) e um ponto P de coordenadas (x, y). 
Vamos calcular a distância deste ponto P à origem. Observando a figura e utili- 
zando o teorema de Pitágoras, temos que d = V x? + y? . Podemos também 
interpretar este resultado dizendo que o comprimento (que passaremos a chamar 
de norma) do vetor (x, y) é V x2 + y? . Denotaremos isto por ||(x, J)Il = 
=V x? + y? . Analogamente, a distância d entre dois pontos (x,, yı) € 
(x2, Y2) é a norma do vetor diferença, isto é, 


d = (x -x2 + -yF 


> 
v= ixi, yil 


Figura 8.1.2 


Consideremos agora um corpo no plano R? que se desloca em linha reta 
da origem até um ponto (x,, yı) por ação de uma força constante F = 
= (x2, Y2). Queremos saber qual é o trabalho realizado. Dos conceitos da física 
sabemos que o trabalho é dado pela equação: T = IFIl- livi - cos onde 8 é 
o ângulo entre v = (x;, yı) e F = (x2, y2). Mas cos 0 = cos (f2 - 04) = 


x x 
cos 8,cos8, + sen asen 0; = Fi . iyi + Fi . pr Portanto, T = 


= XX + yıy2. Ou seja, o trabalho produzido é um “produto” dos vetores ve 
F. denotado por (v, F), e dado pela regra: (v, F) = (x1, Ji), (%2, Y2)) = 

= XX2 + YiJ>. Este produto recebe o nome de produto escalar ou produto 
interno, e tem uma relação importante com a norma de um vetor v = (x, y): 


IIll = Vx +92 =Vx.x tyy = VO. v). 


Se, ao invés de trabalharmos no plano R?, estivéssemos trabalhando no 
espaço R? (munidos de um referencial cartesiano ortogonal), teríamos encon- 
trado uma expressão similar para o produto escalar: 
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(Cr, Yis Zij (X2, Y2, Z2) = XX + Yy, + 2122 


e a mesma relação com a norma de um vetor v = (x, y, 2) 
$ + 


Ivi = Vx? +y? EA = Viv. 


Voltando ao caso do plano, se tivéssemos trabalhado com um referencial 
não ortogonal (eixos não perpendiculares), e quiséssemos calcular a distância da 
origem até um ponto P (cujas coordenadas em relação ao referencial fossem 
(x, y)), teríamos, usando o teorema de Pitágoras, 


d = I(x, yll = V (x + y cosa)? + O sena)? = x? + (2cos ajy +y? 


a x —y “cosa pe x 
Figura 8,1.3 


Observe que, se usássemos o produto escalar 


(xi, yi), X2, V2) = xixa + YA 


neste caso não valeria a relação Ivl = Vv, v), mas ela passaria a valer se 
usássemos a seguinte regra para o produto: 


(Cr, Y1), X2, Y2} = xix, + (cosa)x,y; + (cosa), + Y1y2 pois 
(v, v) = (x, y), (x, y) = x? + (cosaxy + (cos ayx + y? = vip. 
Portanto, novamente a noção de distância poderia ser dada a partir de um pro- 
duto interno de vetores. 

Concluímos destes exemplos, que o processo usado para se determinar 
medidas num espaço pode variar e, em cada caso, precisamos ser bem claros so- 
bre que produto interno (e consequentemente sobre que norma) estamos tra- 
balhando. Estes produtos, no entanto, gozam de propriedades que são utilizadas 
para definir produto interno num espaço vetorial real qualquer. 


8.1.1 Definição: Seja V um espaço vetorial real. Um produto interno so- 
bre V é uma função que a cada par de vetores, v} e v,, associa um número 
real, denotado tv,, v2), satisfazendo as propriedades: 
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i) tv, v) > O para todo vetor v, e 

(v, v) = 0 se, e somente se v = 0. 
ii) (avi, Y2) = atvi, V2) para todo real a. 
iii) (vi + Y2, Y3) = (Vi, Va) + (V2, Vad. 
iv) (Vi, v2) = (va, vp. 


8.1.2 Exemplos 

Exemplo 1: O produto escalar usual de vetores do espaço Rê. 

Para v = (x1, X2, X3) € W = W1, Y2, Ya) 

(v, wW) =X) + XP, t X33. 
De modo análogo, define-se o que chamamos produto interno usual para O €s- 
paço R”: 
Dados v= (X1, X2, = Xn) € W= Oi Y2; os Yn) 
(v, W) =X) t Xaya to + XnYn 


Veremos em 9.1.1 que, uma vez escolhido um tipo especial de base, todo pro- 
duto interno tem uma expressão como esta. 


Exemplo 2: V = R?, v; = (x1. Y1) € Y2 = (x, Y2) 
(Vi, V2) = 2X1X2 -= X1y2 — XV ta 
Exemplo 3: Se V é o espaço de funções contínuas no intervalo 
jo. 1], dadas f, e f, E V, definimos 
(ff) = J à (Oh dt 


Poderemos verificar que as quatro condições da definição são satisfeitas 
em cada exemplo e, portanto, €,) é um produto interno. 


B=(2,3,2) 


C=(2,2,1) 
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Exemplo 4: Um campo elétrico uniforme induz uma força constante dada 
pelo vetor f = (10, 2, -S) em uma partícula carregada eletricamente. Vamos 
calcular o trabalho realizado quando a partícula se move na trajetória que co- 
meça e termina em A, dada pela Figura 8.1.4. O trabalho total é 


T = TaB + Tgc + Tea 
onde Tap é o trabalho realizado de A a B etc. Ainda, AB = (2, 3. 2) - 
ai G, l, 3) = G, 2; -1), BC = (O, -1, -1) e CA = (-1, -}, 2). Como foi mos- 
trado na introdução, o trabalho é o produto interno da força pelo vetor que 
dá o deslocamento. Então TAg = (f, AB) = ((10, 2, -5), (1, 2, -1)) = 19, 
Teca = -22. Portanto, T = 0. 


Exemplo 5: Uma fábrica produz um determinado componente eletrônico. 
Devido a variações na linha de produção, qualidade de material etc., verifica-se 
que os componentes não têm todos a mesma durabilidade. Fazendo-se experiên- 
cias com relação ao número de horas de uso efetivo, obtém-se a seguinte tabela 
que relaciona durabilidade com a respectiva probabilidade. 


durabilidade/h | 2000 | 2500 | 2700 | 3000 


probabilidade 


Queremos saber a durabilidade média dos componentes. 

Temos, então, a durabilidade média (ou valor médio ou valor esperado) 
que é 

. 2000(1/3) + 2500(1/5) + 2700(1/5) + 3000(4/15) = 2520 horas. 
O que queremos observar, no entanto, é que a expressão da durabilidade média 
é exatamente a do produto interno canônico em R* do vetor probabilidade 


> „+ „t 3 $) pelo vetor durabilidade (2000, 2500, 2700, 3000), isto é, 
11d 


4 
AE STE STE O, 2700, 3000} 
G > 5 , 5 , T3) (2000, 250 + ) 
De modo geral, se uma grandeza pode assumir valores x,, x3, ..., Xn com 
probabilidades pi, P2, -- Pno respectivamente, então o valor médio da grandeza 


(também chamado valor esperado) é dado pelo produto interno canônico em 
R” 


Fi 8.1.4 = 
igura (Pi Das Pa) (X1, X2, o Xn) = PiX +... + Pan Biblioteca de Ç> 


Ciência & Tecnol 
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Na seção 8.7 você poderá ver uma outra versao deste fato, juntamente com ou- 
tras aplicações estatísticas do produto interno. 


O produto interno é usado para caracterizar a noção de perpendicularis- 
mo ou ortogonalidade de vetores. Formalmente: 


8.1.3 Definição: Seja V um espaço vetorial com produto interno (, ). 
Diz-se que dois vetores v e w de V são ortogonais (em relação a este produto 
interno) se (v, w) = O. No caso em que v e w são ortogonais, escrevemos 
viw. 


Propriedades: 


i) 0O lv para todo v E V. 

ii) v l w implica que w l v. 

üi) Sev lw para todo w E v, então v = O. 
iv) Sev, Lwe v lw, então v; t v, l wW. 
v) Sevyvlwe é um escalar, Avi w. 


Vamos demonstrar a primeira delas e voce poderá provar facilmente as 
outras, usando as propriedades do produto interno. 
i) Para mostrar que O é ortogonal a todo vetor v, lembremos que O = 
= 0.» v e, portanto, (0, v) = (0 - v, v) = O <v, w = Q. 
A noção de ortogonalidade tem uma aplicação interessante na verificação 
da “honestidade” de apostas. Vejamos isto em um exemplo. 


Exemplo: Duas pessoas A e B fazem a seguinte aposta: elas vão jogar 
duas moedas simultaneamente e, se o resultado for duas caras, A ganha dez 
cruzeiros, se for duas coroas, A ganha sete cruzeiros, e se for uma cara e uma 
coroa, B ganha 9 cruzeiros. Queremos saber se esta aposta é justa, isto é, se À 
não tem mais probabilidade de ganhar do que B, ou vice-versa. 

Para isto, vamos calcular o valor esperado por A e B. Observamos então 
que a probabilidade de dar duas caras é 1/4, de dar duas coroas é 1/4 e de dar 
uma cara e uma coroa é 1/2. O vetor probabilidade é então (1/4, 1/4, 1/2) e o 
vetor aposta do ponto de vista de A é (10, 7, -9) e do ponto de vista de B é 
(-10, -7, 9), onde o sinal menos indica a perda da aposta. O valor esperado 
por À é dado pelo produto interno 


(1/4, 1/4, 1/23) 00,7, 9) = 1 (10) +50) SO) -y 


enquanto que o valor esperado por B é 


(1/4, 1/4, 1/2), CIO, -7, 9) = 


|= 
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O valor esperado por B é positivo, indicando que ele tem vantagem na aposta, 
enquanto que o valor esperado por A é negativo, indicando que ele tem maior 
probabilidade de perder a aposta. Esta só seria justa se não houvesse vantagem 
para nenhum dos apostadores, isto é, se o valor esperado para ambos fosse nulo, 
ou seja, o vetor probabilidade fosse ortogonal ao vetor aposta. 

O resultado a seguir estabelece uma relação entre ortogonalidade e inde- 
pendência linear. 


8.1.4 Teorema: Seja tvi. Vão ces Vn) um conjunto de vetores não nulos, 
dois a dois ortogonais, isto é, 


(vv) =0 parai#j. Então {v;, ..., vg] é linearmente independente. 


Prova: Seja a4 V, tavo + ... + nY = 0. 
Fazendo o produto interno dos dois membros da igualdade acima por v;, temos: 


Cava to tanva Vi) = (0, vi) 


e, portanto, a; (vi. v) +... + ai (Vi, vi) +. + an (Yn. vV) = 0. 
Como {vj, v;) = O para j Æ i e (vi, Vi) + O, temos a; (vi, v;)=0 
e assim a; = 0. 
Como isto vale para todo į = 1, ..., n, temos a, = 0, ..., an = 0; logo 
{vis a O LL 


Você já deve ter notado que quando se trabalha no espaço ( Rº), em ge- 
ral é mais simples usarmos a base canônica (7 3 Î, k}. Isso se deve em grande 
parte à característica de que estes vetores são dois a dois ortogonais. A conve- 
niência de bases desse tipo se mantém para espaços vetoriais quaisquer, como 
você verá em 8.2. 


8.1.5 Definição: Diz-se que uma base ivi, ..., Vn} de V é base ortogonal 
se (v;, v) = O para i É j, isto é, os vetores da base são dois a dois ortogonais. 


Observe que, pelo teorema anterior, se obtivermos um conjunto de n ve- 
tores dois a dois ortogonais num espaço de dimensão n, este conjunto será uma 
base ortogonal. 


8.2 COEFICIENTES DE FOURIER 


Bases ortogonais são importantes porque existe um procedimento padrão para 
se encontrar as coordenadas de um vetor qualquer em relação a elas. Seja V 

um espaço vetorial com produto interno (,), 8 = {v;, ..., Vp} uma base orto- 
gonal de V e w um vetor qualquer de V. Vamos calcular as coordenadas de w 
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em relação a 8. Sabemos que w = xiV; + Xav2 t... + XnYn e queremos deter- 
minar a iésima coordenada x;. Para isto, façamos o produto interno dos dois 
membros da igualdade acima por v;. Então (w, vi) = x;(v;, vp) 

(w, vi) 
(vi, vi) 


donde x; = . Esta coordenada é chamada coeficiente de Fourier de w 


em relação a v;. 


8.2.1 Exemplos 


Exemplo 1: Seja V = R? com produto interno usual e 
8 = {(1, 1), CI, DI 
Observamos que 8 é uma base ortogonal, pois ((L, 1), (-1, 1)) = 1(-1) + 
+ (1) = 0. Calculemos [(2, 3lp- 
Existem x, e x, tais que 
(2, 3) S x(l, 1) + x2(-1, D, 
onde x, e x, são as coordenadas do vetor (2, 3) em relação à base É que esta- 
mos procurando. 


(2, 3), (1, 1) (x (1, 1) + x:(-1, 1), (1, 1)) 
(x (1, 1), (1, 1) + (x2(-1, 1), (1, 1) 


21, 1), (1, 1) + x: ((-1, 1), (1, 1} 
O segundo termo, x, ((-1, 1), (1, 1)), é nulo e assim, 
2,3} 0,1)_5 


%4 = m, D,a, D 2 
A EE 


Anal t e E 
nalogamente, “(CD C1, 1)) 72 
5/2 
Portanto, IC, De E 
1/2 


Vamos formalizar agora a noção de comprimento de um vetor num es- 
paço vetorial. Faremos isto de tal forma que seja verdadeira a relação vista em 
8.1, entre produto escalar e norma. 


8.3 NORMA 


8.3.1 Definição: Seja V um espaço com produto interno é, ). 
Definimos a norma (ou comprimento) de um vetor v em relação a este produ- 
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to interno por lvi = v <v, v). Se livi = 1, isto é, (v, v)= 1, v é chamado ve- 
tor unitário. Dizemos também, neste caso, que v está normalizado. 

Observe que todo vetor não nulo v € V pode ser normalizado, tornando 

k ; l 
u= ivii Se considerarmos, por exemplo, V = R? e (,) o produto intemo 

ī 2 

usual, então se v = (X1, X2, X3) E R°, |IvI| = V (v, v) = Vx] + x5 + x que 
é o comprimento do vetor v. Ássim, para v = (1, 2, -1), teremos o vetor nor- 
malizado. 


1,2, -i GE -l 


-3 É A IR 2 
"= ju? 12 +72 +C O EAF) 
A noção de norma formaliza o conceito de comprimento. 


Exemplo: Vamos calcular a força (que é um vetor) de atração entre dois 
corpos de massas 2 e 5 unidades, colocados nos pontos (1, 3, 5) e (2, 1, 0), 
respectivamente, sabendo que a intensidade da atração entre eles é dada pela 


2 


lação Zi + m d $ do primei d d 
Te ação a , Onde Mm, € a massa do primeiro corpo, ma, a do segun oe 


d a distância entre eles, e sabendo ainda que a força age na direção da reta 
que une os dois pontos. 


(2,1,0) 


Figura 8.3.1 


Vemos que F deve ser um vetor na direção e sentido de 
; . 2-5 1 1 
z 3. 5} = (1. -2. -5) e deve ter intensidade —. > — = — =— 
eA E e APIS ia, -2,-5)1? 30 3 
ou seja, F 5 u, onde u é um vetor unitário na direção de (1, -2, -5). Por- 


tanto, 
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2, - — 
us Ia (UND , -2/30 , 5/ V30 ) 


l 
e F=5 (1/30, -2//30, 5//30 ) = (1/3430, -2/3 V30 , 5/3430) 


Vejamos agora que a definição formal de norma tem realmente todas as 
propriedades que esperamos de uma noção de comprimento. 


Propriedades: Seja V um espaço vetorial com produto intemo. Para quais- 
quer yy wem V eaER. 


i iivili >0 e ilvil = 0 se, e somente se v = 0. 
ü) lavi = lælljvil 

mi) lv, wl < livi w!l (Desigualdade de Schwarz) 
iw) lv+wll< livi + Iw]; (Desigualdade triangular) 


Prova: Você pode mostrar i) e ii) a partir das propriedades do produto interno. 
iii) Sejam v e w em V com v + 0. (Para v = O vale a igualdade Itv, w)l = 
= livi liwli = 0.) 
Para qualquer t E R, (tv + w, tv + w) > Q, isto é, 
(v, V + Av, w) +w w) oO 


Temos então um trinômio do 2º grau que deve ser positivo para qualquer va- 
lor de t. Como o coeficiente (v, v) de ?? é sempre positivo (v # 0), o discri- 
minante A deve ser negativo: A = 4(v, w} - 4(v, v)(w, w) < 0. 

Isto é, 4(v, w? - 4IjvÉ Iwi? < 0, o que implica que Iv, w)l < IlvilIlwil. 
iv) A desigualdade triangular você pode fazer como exercício. 


8.3.2 Ângulo entre dois vetores 


A desigualdade de Schwarz nos dá a possibilidade de definir ângulo entre 
dois vetores não nulos em um espaço vetorial V munido de um produto inter- 
no. Sejam v, w E V não nulos. Então 8.3.1 (tir) pode ser escrito como 


Cv, w} 
livi ilw] 
(v, w) 
vi will o 


tre v e w. Observe que esta noção é compatível com a noção de ortogonalida- 
de pois, se (v, w) = 0, então cos 0 = 0; logo 0 = n/2. 


Iv, w)] 


——— < 1 < l, e portanto existe um ângulo ĝ entre 
vlw) 


ou seja 


O e q radianos tal que cos = Este ângulo 6 é chamado ângulo en- 


Seria muito interessante se você verificasse agora que se considerarmos o 
plano R? ou o espaço R? com o produto interno usual, o conceito geral de 
ângulo aqui definido coincidirá com o conceito geométrico de ângulo entre dois 
vetores. 
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Exemplo: Sejam V = M(2, 2), as matrizes quadradas de ordem 2 reais e 
o produto interno dado pela expressão (comprove que realmente é um produto 
interno, testando as propriedades): 


a b e f 
c d|’ |g f De ae + ao + sog san 


Vamos calcular o ângulo entre as matrizes | ; | e | É | segundo es- 
01 -1 1)" 


te produto interno. Então 


do iki p- 
o aiee dee 


1 1l 
Portanto, cos8 = 1/2 V 10 e assim, 0 = arccos 12 V10. 


=2 e 


Em 8.7 você poderá ver que a noção de correlação usada em estatística 
provém do conceito de ângulo entre dois vetores. 

Também utiliza-se o conceito de norma para caracterizar o tipo de base 
que, em geral, é mais conveniente quando se trabalha com um determinado 
produto interno. Numa base deste tipo as coordenadas de um vetor são dadas 
por um produto interno. 


8.3.3 Definição: Seja V um espaço vetorial com produto interno. Diz-se 
que uma base $ = (v,,..., Vn} de V é ortonormal se for ortogonal e cada ve- 
tor for unitário, isto é, 


O se ij 
(vi, y) = E 
l se i=j 
Observe que se tivermos uma base ortonormal tv, o Val, os coeficien- 
tes x; de um vetor w = x,v; +... + XnYn São dados por 
(w, Vi) 
XE = (w, Vj). 
i (vi, vz) 14 


Exemplo: Seja V = R? e <,) o produto interno usual e 
B = ((1, 0), (0, 1)) uma base ortonormal, temos x, = (y, e1) € x, = (V, e2). 
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À 
x2=tu,89) p= prestei 

] 
l 
1 
82 l 

= ES 

84 x1=(y, 8) 
Figura 8.3.2 


8.4 PROCESSO DE ORTOGONALIZAÇÃO DE GRAM-SCHMIDT 


A partir de uma base qualquer de um espaço vetorial existe um processo para 
se obter uma base ortonormal. Inicialmente vamos dar uma descrição deste pro- 
cesso de ortonormalização para uma base 8 = (vi, va). 

Seja v; = vı. Precisamos encontrar a partir de v} um novo vetor v, Or- 
togonal a v}, isto é, (v3, vi) = O. Para isto tomamos V} = Vz - cv,, onde c é 
um número escolhido de modo que (vz, vi) = 0, isto é, (v2 “cv, vVD=O. 


Isto significa que 


Ficamos então com 


v =y 


' (v2, vi) , 


Vo = V2 - 
2 2 (vo! 


Observe que v} foi obtido de vz, subtraindo-se deste a projeção do vetor v, na 
direção de vi, 
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' ' me N a 2... 
e que v; e v, são vetores ortogonais não nulos. Podemos então normalizá-los, 
r 
vi v; 
u; = —— e u z= 2. 
vi 2 vil 


obtendo uma base 8” = lu, u} que é ortonormal. Como você pode afirmar 
que u; eu, são LI? (Veja 8.1.5) 


8.4.1 Exemplo 


Exemplo 1: Seja 8 = {(2, 1), (1, 1)}} uma base do R?. Vamos obter a 
partir de 8 uma base ortonormal em relação ao produto interno usual. 
Sejam v; = (2, 1) e va = (1, 1). 


+ 
si FNS (2, 1) 
vY = Vo -CV 
sz . ca r é 
Como já vimos, a condição de que v, seja ortogonal a v; implica que 


= tva, vi) 
vs vi) 
e, portanto, 
£ = Es (Y2; vi) E w ((1, 1), (2, 1) = 1 2 
aai ca Do io ni O = Egas) 


Normalizando estes vetores obtemos: 


r r 
vi v 


Então, 8" = (u,, u,) é uma base ortonormal. 
O procedimento de ortogonalização de dois vetores pode ser generalizado 


para uma base $ = {v;, ..., Vn}. Tomemos como no caso anterior 
Vi =W 
+, 
' “(va Y1) 
v} =V - cv; onde c =" 


(vi. VI) 


Então, v; é ortogonal a v}. 

Vamos procurar agora um vetor v3 que seja ortogonal ao mesmo tempo a 
vi e v}. Por analogia ao caso anterior vamos estabelecer que v} = 
= va - mv; - kvi e determinar os valores de m e k tais que (v3, v)) = 0 e 
(v3, vh) = 0. Desenvolvendo estas duas condições, obtemos: 
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(w5, yp) = 0 e (Y3 - my3 - kyi, vi))=0 
< (Ya, Vi) - mw vi) =- kvi, vD) =0 


Assim, como (v4, vi) = O, temos (V3, V2) = O se, e somente se 


r 
= (v3, vi? 
(vi, vD 


Da mesma forma, (vs, v2) = O se, e somente se 

Gui (V3, va) 

1 
(va, vo) 
E portanto, 

(as Vo) o Va, VI) y! 
m l. Ae 7 1 

(va, V2) (Vi, vi) 


Observe que k e m são os coeficientes de Fourier de v} com relação a v; €a 


Va = Va 


v, respectivamente, ou seja, v3 é obtido de v3, subtraindo-se suas projeções 


sobre vj € vo. 
Procedendo de maneira análoga, obtemos os vetores Vas s Yne 

Assim, a partir de uma base 8 = IVi, ., Yn} de um espaço vetorial V, 
construímos a base ortogonal {v}, ..., vn) dada por: 


= 
, 
Frin (v2, vi) r 
Y=- ( T 5 
Vi, Y1 
' 
ey a VD Va, Y1? v 
EE 3 Ol (v3, va) (vi, vi) 


' + 
Ea Wns Yn- , (Yn, Y1) v! 
E CONT ORAR OS S, n-1 ~ CO EAR conti 
a Cro Yn-1) Wi, VOS O 
Este procedimento é conhecido como processo de ortogonalização de 


Gram-Schmidt. 
Se quisermos agora Obter uma base ortonormal, basta normalizarmos os 


vetores vj. Isto é, tomando 


t 

vi ; 

uj = vii . obtemos a base {u;, U5, ..s u,) de vetores ortonormais. 
; 


Exemplo 2: Seja 8 = {(1. 1, 1), (0, 2, 1), (0,0, 1)} uma base de Rº. 


Vamos obter a partir de $ uma base ortonormal em relação ao produto usual. 


Sejam vi = (1, 1, 1), Y2 = (0, 2, 1), Y3 = (0,0, 1). 
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vi =v =(1,1,1) 
banos GAN g (0,2, 1). G, 1,1) 
Y =v- T mz Yi = (0.2, 1)- ` Às >. (G, 1, I) E 
Gi, vD rea Ddr 1» ED) 
3 
=(0, 2, D-36, l, 1) = (-1, 1, 0). 
v3 =v3 (Va. V2) Vá (v3, vi? ' 


vi Pv 
= «0, 0, 1), (ct, 1,0 
= (0, 0, 1) - et, 1,0) 
( CiLO CILop Ch LO - 
m «0, 0, D, (1, l, 1) 
CL, 1, 1), (1, 1, 1% (1.1, 1)= (0,0,1) -0 -30 l, Ds 


ER DE S Re 
=( 3º73:3) 


Então os vetores normalizados são 


é Sie (95: 75-95) 


i -miT EA) 


t 2 
e 8'=(u,,u,,u;) é uma base ortonormal. 

Observe no exemplo que, dos vetores originais da base 8 o único que foi 
preservado, pelo menos em sua direção, foi o vetor v, a partir do qual foi ini- 
ciado o processo de ortogonalização. Vale a pena notar que partindo da mesma 
base 8 = {v;, V2, V3} poderemos obter uma outra base ortogonal 8” iniciando, 
por exemplo, o processo de ortogonalização a partir de v3(v; = v, = (0,0, 1)) 
E caso, os eteulos seriam simplificados pois v3 já é um vetor unitário. 

teremos assim B" = (wi. w2, w5),onde o vetor cuja direção é preservada é 
Va, € não mais v,. 


Exemplo 3: Seja 8 = ((1, 0), (0, 1)) a base canônica de R?. Vamos obter 
a partir de uma base ortonormal em relação ao produto interno de R?, defi- 
nido por 
(Or, Yi), (X2, Y2) = 2X1X2 = XD = Ma) + yiya. 
Sejam v; =(1,0) e v, = (0, 1). 
vi = Vi = (1, 0) 
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E E CEI O ET 
vv 1 = O D -aoa o 4 OAOD t 


l l 
+5 0,0)=(5, 1) 


Normualizando estes vetores obtemos: 


u =p (97.9) 


m = (2,47) 


Assim, 8' = lu, u,} é uma base ortonormal em relação ao produto interno 
definido acima. Observe que a base inicial 8 é uma base ortonormal 
em relação ao produto interno usual de R?, mas não em relação ao produto 


aqui definido. 
8.5 COMPLEMENTO ORTOGONAL 


Consideremos um espaço vetorial V munido de um produto interno (,) eum 
subconjunto não vazio S de V. (S não é necessariamente um subespaço.) Con- 


sideremos então o subconjunto de V: 
s!=(veV:v é ortogonal a todos os vetores de S}. 

Valem os seguintes resultados com relação a S. 

i) st é subespaço de V (mesmo que .$ não o seja). 
De fato, se v) e vz pertencem a S- e w é um vetor qualquer de §, en- 
tao v; lwev, Lwe de 8.1.4. (iv)vi + vı 1 w, OU seja, Vi + 
+v, € si Analogamente, usando 8.1.4, (v) Av, L w para qualquer À E R. 

ii) Se S é subespaço de V, então V = SO st (veja 4.3.5). 
e SL é chamado complemento ortogonal de S. Para mostrar isto, basta 
tomar uma base ortogonal de $ {v1, Va, -> vk} (veja 8.4), estendé-la a 
uma base de V, (vi, os VkWk+1>  Wn) e aplicar o processo de 
Gram-Schmidt, observando que v,, -.., Yg não mudam no processo. 
Obtém-se assim uma base ortonormal de V, {v1, -+ Vk: Vk+1o <., Yn} - Note 
que {Vk +i,- Yn} é uma base de SL (verifique). Assim, 


V= [vi o EJO [vesis o Yal = SOS 
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8.6 ESPAÇOS VETORIAIS COMPLEXOS — PRODUTO INTERNO 


No Capítulo 4, quando introduzimos espaços vetoriais reais, comentamos que 
se os escalares fossem números complexos, (C) teríamos ni espaço vetorial 
complexo. O que queremos nesta secção é ressaltar um fato importante que 
ocorre com o produto interno num espaço vetorial complexo. 

l Observe o que ocorreria se tivéssemos V, um espaço vetorial sobre C, mu- 
nido de um produto interno (, ) segundo a definição 8.1.1 e quiséssemos, dado 
v não nulo em V, calcular o produto (w, w) onde w = iv. Então por na lado 
pela condição (i) de 8.1.1, temos (w, w) > 0. Por outro lado em w) = 
= dv iv) = i(v, iv) = iliv, v) = i?°(v, v) = -1 v, v} < 0 pois w y) >00. 

Então (w, w) deve ser ao mesmo tempo maior que O e menor que 0, o que é 
absurdo! Isto quer dizer que as duas condições 1) (v, v) > O para todo ve 

iv) (v, w) = (w, v) para quaisquer v, w são incompatíveis quando estamos tra- 
balhando com espaços vetoriais complexos. Sendo assim, precisamos de uma 
nova definição. 


8.6.1 Definição: Seja V um espaço vetorial complexo. Um produto inter- 
no sobre V é uma aplicação 


(,N: VXV -> C 
(u,v) = <{u,v) 


que satisfaz as seguintes condições: 
i) <v, v) > 0 para todo v E V e (v, v) = 0 se, e somente se v = 0. 
ii) (au, v) = alu, v), para todo «E Ceu, ve V. 
iii) (u, + u, v) = (u, v) + (u2, v) para todo w, u2, vE V. 
iv) (u, v) = (v, u) para todo u, v E V. 


Observe que a condição (iv) foi mudada em relação ao produto interno 
definido sobre R. Ela nos diz que <u, v) é o conjugado de (v, u). 


Exemplo: Sejam V = C, vi, v3 E V com v; = (%1, X2, X3) € v2 = 
= (X1, Y2» Y3). A expressão 
(Vi, V2) =X t X22 t X33 
define um produto interno em C?. Verifiquemos a condição (iv). 
o Vas mos Yı¥ı Poa Y3X3 = YıXı + YX +YaX3 = Pã + 
+ Dako + J3X3 = X1Jı + x272 t X33 = (Y1, V2) 


Um exemplo importante de espaço vetorial complexo é dado pelo con- 
junto das soluções de um sistema de equações diferenciais lineares. Ele será 
apresentado no Capítulo 12. 
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Do mesmo modo que definimos os conceitos fundamentais (norma, dis- 
tância, ortogonalidade etc.) num espaço vetorial real com um produto interno, 
podemos definilos num espaço vetorial complexo. Por exemplo, a norma de 
um vetor v = (xi, X2, X3) E C? em relação ao produto interno dado no exem- 


plo anterior é 
= = = i 2 2 
livi = Vv, vV} = V xi, + xo t x3X3 = V lxi + ixl? + lxal 


Não vamos tratar mais detalhadamente sobre este assunto porque, neste livro, 
estamos mais interessados em espaços vetoriais reais. 


8.7 PRODUTO INTERNO E ESTATÍSTICA 


Uma situação que aparece frequentemente na análise de experimentos é a se- 
guinte: verifica-se que o fenômeno estudado tem n possibilidades distintas S,, 


S3, .., Sn de se manifestar, cada uma delas com probabilidades p,, 
Pa» = Pn, Tespectivamente. O conjunto S = (S,, ..., Sn) é chamado espaço 
amostral e o vetor p = (Pı, ..., Pn) é chamado vetor de probabilidades. Por 


exemplo, no lançamento de uma moeda, podemos considerar S = (cara, coroa) 
e p = (1/2, 1/2); no lançamento simultâneo de duas moedas, S = 

= ((cara, cara), (coroa, coroa), (cara, coroa)) e p = (1/4, 1/4, 1/2); num grupo 
de 3 pessoas podemos considerar § = {pessoa 1, pessoa 2, pessoa 3} e p = 


= (1/3, 1/3, 1/3) se cada uma delas tiver a mesma probabilidade de ser escolhi- 


da ao acaso. 

Se em um espaço amostral § = (S,, ..., Sn}, com respectivo vetor de pro- 
babilidade p = (pı, ..., Pn), associarmos, a cada elemento S; do espaço amos- 
tral, um valor X;, teremos o vetor X = (X,, ..., Xn) que chamaremos de variá- 


vel aleatória. Vejamos alguns exemplos. 


8.7.1 Exemplos 


Exemplo 1: Se duas pessoas A e B fazem a seguinte aposta: lançam uma 
moeda e, se der cara, A ganhará 10 fichas e, se der coroa, B ganhará 10 fi- 
chas. Então teremos § = (cara, coroa), p = (1/2, 1/2), a variável aleatória 
do ponto de vista de A será X = (10, -10) e a variável aleatória do ponto 
de vista de B será Y = (-10, 10). 


Exemplo 2: Num grupo de três pessoas A, B, C que pesam 70 kg, 80 kg 
e 50 kg, respectivamente, podemos considerar S = (A, B, C}, p = 
= (1/3, 1/3, 1/3) e a variável aleatória X = (70, 80, 50). 
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Exemplo 3: À situação escrita no Exemplo de 8.1.3 podemos associar o 
espaço amostral S = ((cara, cara), (coroa, coroa), (cara, coroa)), o vetor de 
probabilidades p = (1/4, 1/4. 1/2) e as variáveis aleatórias X = (10. 7. -9) que 
dá a aposta de A, e Y = (-10, -7, 9) que dá a aposta de B. 


na ig Na pao : = {Si, o So); O vetor de probabilidades 
= (Pi, o Pn avel aleatória X = (X,,..,X,), d i 
valor médio de X (ou valor esperado) ao ieo A ad 
X=p,X, + PiX +.. pad 
de variança de X ao número 
K(X) = p(X, - Xy + = Epal Ay - XF 
e de desvio padrão de X ao número 
D(X) = V W(X). 


A ligação destes conceitos com o conceito de produto interno é estabele- 


cida da seguinte forma: nas condições anteriores, consideremos em R” o seguin- 
te produto interno 


(i co, Xn), Wis «us Yn)? = PiXiyi +... + PnXnYn 
Temos então que, em relação a este produto interno 
X =X, cs) 
YX) = (X - X (l, 1), X- X(, 1) 
D(X) = |X- (1. .., ni. 


Você pode verificar tranqüilamente estas igualdades. 


8.7.2 Exemplos 


Exemplo 1: O produto interno associado é 


1 1 
xi, y1), (x2, y2) = q%1%2 +51 
Então X = «10. - er . Lz = 
(O, -10), (1, 1) 7 * 10 1 +5 (-10) > 1 =0 e D(X) = 


= I0, 10) - 0(1, 1)I = (10, 10) = (1/2910? + (1/DIO? = 10. (Faça o 
mesmo para a variável aleatória Y.) 


Exemplo 2: O produto interno é 


1 1 | 
xi, Yi, Zi), X2, Y2, 22) = 3%1% + 3Y1)a + 32122 
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Então Y = ((70, 80, 50), (1 D=S- W 1458001 + sos 


, isto é, o valor médio da função aleatória peso (o peso médio) é 200/3 


e o desvio padrão é 


D(X) = II(70, 80, 50) - = (1, 1, Di = II(10/3, 40/3, -50/3) Il 


= (310/32 + (1/3X40/32 + (1/3X-50/3)* = D vis 


Exemplo 3: O produto interno é 


1 1 1 
(Xi Yis 21), (X2, Ya, 22) = g% * qria t 972122 


am 1 ] 1 
Então X = ((10, 7, -9), (1,1,1) =g: 10147-701 -7:9-1=-4 


DOS = 100, 7, 9 - Cha 1 DIE, Z, -SDI e 15.3 


(Compare com o Exemplo de 8.1.3.) 

Consideremos agora uma situação em que a um dado fenômeno associa- 
mos o espaço amostral § = (S1, -.., Sn), O vetor probabilidade p = (Pi, -- Pn) 
e dois aspectos do fenômeno são representados por duas variáveis aleatórias 
X = (Xi, so Xn) e Y = (Yi, Yn). Estamos interessados em descobrir qual 
é a relação entre X e Y. Sejam Xe Y os valores médios correspondentes a X 
e Y. Considerando os vetores 


X- X0, ai) =% - Asa Xn - X) 


y- Fa = (Y, - Y, ae Yn - Y) 


Vejamos o que acontece se existir um número À tal que 
Y, - Tas Yn - De NX, - X, as AA) 

Neste caso podemos concluir que se X mudar, Y mudará proporcionalmente, 
ou seja, chegaremos à conclusão que os aspectos X e Y estudados estão forte- 
mente relacionados. Mas a existência deste número À é equivalente à condição 
de que os vetores tenham a mesma direção, ou seja, o ângulo 8 entre eles é 0 
ou 7, e portanto cosô = 1 ou -1. 

Assim, chegamos à conclusão, que o valor do co-seno do ângulo entre os 
vetores X - X(1, ..., 1) e Y - Y(1, ..., 1) é uma medida da relação entre X e 
Y. A este valor os estatísticos chamam de coeficiente de correlação linear entre 
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Xe Y e denotam-se por r(X, Y). Aplicando a fórmula do co-seno do ângulo 
entre dois vetores, temos: 


(X-X(, cs 1), Y- Y(1, ..., 1) 


z(X, Y) = = 
XX, DIIY-TOA,.., DI 


Observamos que o produto interno indicado é aquele montado a partir do ve- 
tor de probabilidades e que quanto mais próximo r(X, Y) estiver de 1 ou -1 
mais podemos dizer que X e Y estão correlacionados linearmente. 


Exemplo 4: Consideremos um grupo de 10 alunos do qual conhecemos as 
notas de Matemática e Física dadas pela tabela abaixo. 


Aluno 123456789 10 


Matemática | 2 857753199 


Física 197274639 7 


Queremos saber qual é a correlação entre os resultados nas duas matérias. Para 
isto, consideremos como espaço amostral o conjunto dos alunos, numerados de 
la 10, S= {1, 2, .., 10}. Como a probabilidade de se considerar as notas de 


qualquer aluno é igual, o vetor probabilidade é, então, p = ( o Juni b) à 


variável aleatória que dá as notas de Matemática é X = (2, 8, 5, 7, 7, 5, 3, 1 
9,9)e a que dá as notas de Física é Y = (1,9,7,2,7,4,6,3,9,7). Calculan- 
do, temos X = 5,6 eY=s5,. 

X- X0, 1)= (3,6; 2,4; -0,6; ...; -4,6; 3,4; 3,4) 

Y- Y(1, ..., 1) = (-4,5; 3,5; 1,5; ...; -2,5; 3,5; 1,5) 

(X-X(0,...,1),Y-Y(1,...,1)) 49 

IX-TA,.., DIP =7,4elY-Y(1,.... DI? =7,2 


e o coeficiente de correlação é 
r(X, Y) = 0,67 


*88 O AJUSTE DE CURVAS E O METODO DOS MÍNIMOS 
QUADRADOS 


Consideremos a experiência na qual se utilizou o circuito abaixo para 
determinar o valor da resistência R de um resistor, 


Bibtiotecá di 


Ciência 
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amperímetro 


bateria LT 


© ~p voltimetro 


Feitas as medidas de corrente para vários valores de voltagem, os dados 
foram tabelados 


corrente (Ampére) | 0,03 


~ 
L 


voltagem (Volts) 


e a seguir colocados em um gráfico 


A partir destes dados, se quisermos obter a relação entre corrente e 
voltagem, inclusive para pontos intermediários ou exteriores aos tabelados, 
deveremos propor uma curva (uma função) que se ajuste aos pontos tabelados. 
A proposta de tal função deverá levar em consideração que: 


i) Qualquer medida contém um erro (inerente ao aparelho de medição, falha 
do operador etc.) 

ii) Pode já existir algum argumento teórico ou de bom senso que nos indique 
qual deve ser o aspecto analítico da função. 


O item (i) nos mostra que exigir que a curva procurada passe por todos 
os pontos não é somente desnecessário mas, provavelmente, errado, enquanto 
que o item (ii) nos mostra que deveremos ter alguma argumentação convin- 
cente para fazer previsões. Juntos, estes itens mostram que entre todas as 
funções com um determinado aspecto analítico deveremos procurar aquela 
que, em um certo sentido, melhor se ajuste aos pontos da tabela. Na 
experiência que estamos considerando, por exemplo, existe uma fundamentação 
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teórica que relaciona a corrente com a voltagem: V = Ri, isto é, o gráfico 
de V em função de i deve ser uma reta passando pela origem e com certa 
inclinação R que mede a resistência. Devemos, portanto, estabelecer um 
mecanismo que forneça o “melhor ajuste” aos dados de que dispomos. 

Como fazer isto? Uma idéia é a de que a reta procurada deve ser tal que 
torne pequenos os desvios (isto é, a diferença entre o valor dado na tabela e o 
valor dado pela reta) em cada um dos pontos da tabela. Mas como garantir 
isto? O método que escolheremos será exposto na secção seguinte. 


Mbll=== Sgt reta a ser 
procurada 


desvios 


8.8.1 O Método dos Mínimos Quadrados 


Observemos inicialmente que se temos funções tabeladas 


de forma que os valores da variável independente x,, Xx2, ..., Xn São sempre os 
mesmos, cada uma dessas funções pode ser considerada como um vetor de um 
espaço vetorial (o das funções definidas nos pontos x4, X2, ..., Xa). Tal espaço 
é isomorfo ao R” (veja 5.3.12) e nele é que trabalharemos. 

Vamos generalizar um pouco a situação da introdução para podermos 
utilizar a linguagem da Álgebra Linear é resolver o problema, 

Suponhamos que conhecemos o aspecto analítico de duas funções g, (x) 
e g2(x) e que queremos “aproximar” uma dada função fx) por uma 
combinação linear de g(x) e ga(x), isto é, queremos achar coeficientes cC e c3 
tais que a função 

gix) = cigi (x) + coga(x) 

seja uma “boa aproximação” para f(x). Por exemplo, se g(x) = 1 e 
&2(x) = x, estaremos aproximando f(x) por uma função afim g(x) =cytcox: 
se gi(x) = sen x e ga(x) = cos x estaremos aproximando por 
g(x) = c, sen x + c, cos x etc. 
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Vamos introduzir agora uma noção de distância entre funções. Para 
isto, lembramos que se tivermos um produto interno <,> num espaço 
vetorial podemos construir uma noção de distância entre dois elementos v; e 
vı como a norma da diferença entre eles. 


distância entre v; e vz = || v; -= nall = V <v, - v2, Y1- n2 > 


Definimos, então, o seguinte produto interno (verifique se realmente é 
um) no espaço vetorial definido no início da secção. 


8.8.2 <fi, h> = fia) f1) + fia) aa) tt ÃO) « f(Xn) 
= Ae) hE) 


i=1 
Com relação a tal produto interno a distância entre duas funções é dada 
pela expressão 


88.3 lf-fl= / ) GED -hEN 
i=1 


Observe que a expressão dentro do radical é exatamente a soma dos 
quadrados dos desvios que existem entre fi(x) e f2 (x) em cada ponto x; da 
tabela. 

Lembrando que se sabemos que a soma de certos números positivos é 
pequena então podemos concluir que cada um desses números é pequeno, 
teremos a chave para descobrir os coeficientes c; e c2: devemos calcular a 
distância entre f(x) e g(x) = cigi(x) + c282(x) a qual, evidentemente, será 
função de c; e c,, e então minimizá-la seguindo os procedimentos normais de 
minimização de funções de várias variáveis (consulte Leithold, L., “O Cálculo 
com Geometria Analítica”, Edit. Harper & Row, SP, 1977). 

Seguindo este caminho teremos a distância entre f(x) e g(x) dada por 


D(c,, c2) =|| f - cigi - cogall = FN - cigi(x;) - cagalx)? 


i=} 


Achando o ponto (c1, c2) que minimiza tal função (isto é, achamos os pontos 
críticos CLM 0 e aro O etc.) teremos que os valores cı e C2 que 

dci dc, 
fornecem a função g(x) = cigi(x) + coga(x) que melhor aproxima f(x) devem 


satisfazer o sistema linear: 
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(5 gi còs) Ci + (> sedet) Cy = 3 gi (x) lc; 

i=1 i=l i=1 

( $, 82 conto) cıt ( 2 g2 (x) g> e») 6 = 5 82 CNi) 
i=1 


i=1 i=1 


ou, lembrando a definição do produto interno 8.8.2. 


o Rs 
<82: 81> C1 t82, g> c= <p, f> 


Como conhecemos a expressão de g; (x) e g2(x), os valores de f(x) nos 
pontos x; da tabela e os produtos internos só dependem dos valores das 
funções nestes pontos, podemos resolver o sistema e obter os valores de cie 
c2. Este procedimento é chamado o método dos mínimos quadrados para 
ajuste de curvas. 


Exemplo: Ajustar uma função do tipo g(x) = a + bx aos pontos da 
tabela 


x 0 1 2 
Kx) | 1,1 | 0,1 | -3,1 


Temos g(x) =a. 1 + b-x?, ou seja, g(x) = 1 e g(x) = x? 

Então <gı,gı>=1+1+1.-1+1.1=3 

Lgi g> =<g, g> =1.0?°+1.1?°+1.2?=5 

<g2,82>=02.02+12.12+22.22=17 

<g,f >=1-1,1+1.01+1-(3,D=-1,9 

<g,f >=02.1,1+12.01+22.(-3,1)=-12,3 
Daí a Sb=-1,9 

Sa + 17b = -12,3 


Resolvendo temos a = 1,12 e b = - 1,05. Portanto, entre as funções do tipo 
a + bx? a que melhor se ajusta aos dados da tabela é 0,912 - 0,927x?. 
(Trace os gráficos.) 

Podemos interpretar intuitivamente a fórmula 8.8.3 (na verdade a 
argumentação a seguir pode ser demonstrada rigorosamente). 

Observe a Figura 8.8.1 onde f representa a função tabelada, g, e g, as 
funções cujo aspecto analítico conhecemos e o plano representa o subespaço 


244 ÁLGEBRA LINEAR 


gerado por g; e g2. À função g = c;8, + cag> procurada é o ponto do plano 
que está à menor distância de f 


Figura 8.8.1 


Intuitivamente sabe-se que tal ponto é o pé da perpendicular ao plano 
(isto pode ser provado rigorosamente). Portanto o vetor f - g é perpendicular 
a gı e gz (que estão no plano). Devemos ter então 


0=<g,f-g>=-c;i<gi,8>-<g,8>+<g, f> 
0=<ga, f-g>=-ci<ga, 81>-Co<ga, 82> t <8 f> 
que são exatamente as relações de 8.8.3, 


Toda a argumentação anterior pode ser facilmente repetida no caso de 
termos um número k (k = 1, 2, 3, ...) de funções g;(x) ao invés de apenas 
duas. Formalmente: 


8.8.5 Se quisermos achar coeficientes c1, C2, ..., Ck tais que a função 
g(x) = ciga(x) + coga(x) + ... + crgklx) é aquela que melhor aproxima uma 
função tabelada f(x) no sentido do método dos minimos quadrados, tais 
coeficientes satisfazem o sistema linear 


anc, tac +. takck = bi 
akci t akaC2 +... + AkkCk = bk 


onde ap=Cg 8j >? 
bi =<8i f > 


e <, > é o produto interno dado por 8.8.2. 
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8.8.6 Exemplos 


Exemplo 1: Vamos resolver o problema do início da secção. Nesse 
problema a corrente i faz o papel de x, k = 1 e gi(i) = i Segundo o resultado 
de 8.8.5, R deve satisfazer 


<Vg>=R<g,81> 


Como < gı, gı >= (0,03)? + (0,06)? + (0,10)? + (0,16) = 0,0401 
<V, g >=10:0,03+18.0,06+32.0,10+40. 0,16 = 10,98 


10,98 


= 273,81 ohms 


Exemplo 2: Sabendo que a população de uma certa localidade variou 
com o tempo segundo a tabela 


Ano 1970 


População X 10º 


aproximando os pontos da tabela por uma função do tipo (t = tempo) 
g)=a+bt+ ct, 
qual será a população em 1990? 

No contexto de 8.8.5 teremos k = 3, g()= 1, gÀ =t, gA =r. 
Além disso, para os números se tornarem menores, identificaremos £ = 4 com 
1940, t = 5 com 1950 etc. Dessa forma 1990 será representado com t = 9. 
Então: <gr,g>a+t< gg, >b+< gg, g >c=<g, f> 

< 82, 820 t< 83, 832 >b +< g, 832c=< ga, f> 
<83, 81 >a + <83, 82 >b t< g, 83C = <8, f> 


onde 

< gi, g1 >= 4, <81, 82> = L82:81 > = 22, <82,82> = 126, 

< g1, 83> =< g3, g1 >= 126, 82,83 = <Sg3,82>= 748, 

< g3, 83> =4578, <81, f > = 6,3, <g2, f > = 36,3, <83, f > = 216,3 
Substituindo e resolvendo o sistema temos a = - 2,415, b = 1,155 e 


c = - 0,075. Assim g(t) = -2,415 + 1,155t - 0,075¢° e a população prevista 
para 1990 será dada por g(9) = 1,905, ou seja, 1,905 - 10º = 19050 pessoas. 
Uma vez entendido o ponto de vista técnico, vamos discutir a confiabi- 
lidade dos resultados obtidos. Em particular, você confia no resultado do 
último exemplo? Por que foi proposta uma função do tipo g(t)=a + bt + ct? 
para aproximar a tabela e não outra? A resposta a esta questão é dada no 
item (if) discutido no início da secção, isto é, devemos ter alguma funda- 
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mentação teórica sobre o fenômeno que estamos estudando (no caso dinâmica 
populacional) para então propor o tipo de função. Na verdade a função 
quadrática proposta no exemplo não satisfaz a este requisito; ela foi proposta 
apenas para exercitar a técnica. Um tipo de função que descreve um pouco 
melhor a dinâmica populacional, apesar de não levar em conta uma série de 
fatores, é g(t) = ae * coma e ba serem determinados. Vamos refazer o 
problema nesta nova condição, lembrando-nos que, nos problemas de previsão, 
a não confiabilidade dos resultados não é devida a Matemática, mas sim a 
quem propôs o modelo teórico. 


Exemplo 3: No exemplo anterior, prever a população aproximando os 
pontos da tabela, utilizando uma função do tipo g(t) = ae”, 

Notamos que na forma como foi apresentado o problema não 
poderemos usar diretamente 8.8.5, pois a função g(t) proposta para aproximar 
não é uma combinação linear de funções conhecidas. Vamos colocá-la noutra 
forma. Utilizando o símbolo = para “aproximadamente”, observamos que o 
problema original é achar a e b tais que 

fo) = a» e 
Aplicando o logaritmo neperiano a ambos os membros, temos 
F(t) =la t) = Ina + bt 
Chamando c, = Ina, cz = b, g(t)=1 e g,(f) = t, temos 
In At) = cigi(t) + coga(t) 
Isto é, o problema fica no contexto de 8.8.5 se aproximarmos não a tabela 
original, mas a tabela modificada. 


Fe) = In At) 


Assim <g,g>=4,  <Zgr 82> =< 8 81> = 22, <8 gı > = 126 
< gi, F >= 1,686,< g}, F > = 10,404 


Temos então o sistema 


de, + 22» = 1,686 
22c, + 126c, = 10,404 


que resolvido fornece c; = 0,226, cz = - 0,822. Donde a = e? = 0,439 e 
b = c, = 0,226. Assim g(r} = 0,439e™?Ś! e g(9) = 3,356. A população prevista 
será de cerca de 3,356 + 10º = 33 560 pessoas. 
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Compare este resultado com o do Exemplo anterior. Qual deles você 
acha melhor? Por quê? 


Em geral sempre que temos uma proposta para aproximarmos uma tabela 
por uma função não linear fazemos certas modificações para obter uma 
situação linear, e então usamos 8.8.5. 

Uma palavra final deve ser dada com relação à nomenclatura. Os estatísticos 
ao utilizarem o método dos mínimos quadrados chamam-no de andlise de regressão 
Assim, fazer regressão linear, quadrática ou exponencial significa aproximar os l 
dados de uma tabela por uma função do tipo a + bx, a + bx + cx? ou a ed res- 
pectivamente, utilizando o método dos mínimos quadrados (8.8.5). ' 


8.9 EXERCICIOS 


1. Comprove que as funções definidas nos exemplos do parágrafo 8.1 são pro- 
dutos internos. 


2. Seja V = R?. Sejam v; = Qi Y1) € V2 = (x2, Y2). Se Oi va) = 
=X, +X)2 tX) + PJ, mostre que f é um produto interno. 


3. Mostre a desigualdade triangular. (Veja 8.3.2 - iv) (Sugestão: |lv + w]? = 
=(v +w, v + w); desenvolva e use a desigualdade de Schwarz - 
8.3.2 - iii). 


4. Seja B = (1, 2), (2, 1)). Use o processo de Gram-Schmidt para achar uma 
base ortonormal $’ de R? em relação ao produto interno usual. 


5. Seja 8 = {(1, 1, 0), (1,0, 1), (0, 2, 0)J. Ache uma base ortonormal B' de 
Rº, em relação ao produto interno usual. 


6. Seja 8 = ((-1, 1), (1, 1). Ache uma base ortonormal! &' de R?, em relação 
ao produto interno definido no Exercício 2. 


7. Determine uma base ortonormal (em relação ao produto interno canônico) 
para o seguinte subespaço de Rº: 
V = {œ DER; x-y +z=0)} 


8. Seja W C R? o subespaço gerado por (1, 0, 1) e (1, 1, 0). 


a) Considere WL em relação ao produto interno canônico. Encontre uma 
base para Wi. 

b) A mesma pergunta anterior se Wi é considerado em relação ao produto 
interno <(x,7,7), (x,),2)>=2x ex +y. y +77, 


Bibliote 
Ciência “ca de 
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9. Seja T: R?>R? dada por T(x,),2)=(2,X-), -z) e seja W = ker T. 
a) Encontre uma base ortonormal para Wl(em relação ao produto interno 


canônico de R°). 
b) O mesmo em relação ao produto interno 


<(x, y, z}, 0,),2)>= Mex +pey rar 


10. Considere o subespaço W de R? gerado por v, = (1, 0,0), v2 = (0, 1, De 
va = (1, - 1, - 1). Sendo <, > o produto interno canônico (a) Ache W~; 
(b) Exiba uma transformação linear T: R?> R? tal que ImT)=We 
ker(T) = WL. 


11. Considere em R? o produto interno 
<(x, y, z), œ, y, Dx Spy are 


a) Verifique se realmente é um produto interno. 
b) A partir da base ((1, 0, 0), (0, 1, 0), (0, 0, 1)) ache uma base orto- 
normal. 


12. Seja P, o espaço das funções polinomiais reais de grau menor ou igual a 
dois. Definimos em P3 


<f, g> i Ho) - (dt 


Considere W o subespaço de P, gerado pelos vetores p(t) = 1 e a(d = 1-1. 


a) <f, g> é um produto interno? 


b) Se a resposta de (a) for afirmativa determine uma base ortogonal para W. 


13. Seja V = R? e S = {(1, 0, 1), (1, 1, 0), 0,1, 1)}. 


a) Encontre st 

b) Encontre uma base ortogonal para S e st 

c) Se S fosse [(1, 0, 1), (1, 1, 0), (2, 1, 1)], qual seria S1? Neste caso, en- 
contre uma base ortogonal para $ e $~. 


14. Seja A = [aj], x n uma matriz quadrada. Definimos o traço de A, TH(A), 


n 
por y di 
i=1 
2 -~-i 
a) Calcule Tr Ê 1 
b} Tr(A » B) = TH(B- A)? 
c) Tr(A) = Tr(A!)? 


d) THA) = (THA TD)! 
e) Tr(A - B) = Tr(A) + Tr(B)? 
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15. Sejam A e B matrizes de M(2, 2). Define-se 
<A, B>=Tr(B'.A) 


a) Verifique que <A, B > é um produto interno. 
b) Exiba uma base ortonormal segundo este produto interno, a partir da 


sda o) 


16. Um corpo é deslocado em linha reta do ponto (-1, 3) até o ponto (5, 2) 
por uma força constante F = (3, 2). Qual é o trabalho realizado? 


17. Podemos definir uma “distância” entre dois pontos P = (x,,y)e Q= 
= (x2, Y2) do plano por d(P, Q) = lx} - xıl + Ip; - y,l (veja a Figura 
8.9.1). Verifique se a aplicação dada por 

(Or XY ), (xa, Ya) = d(P, Q) 
define um produto interno no plano. 


“o 


lya -y1 | 
Figura 8.9,1 


? 
| 
| 
| 
| 
| 
| 
! 
j 


18. Uma partícula percorre a trajetória OABO onde O, A e B são os pontos 
(0, O, 0), (1, 1, 0) e (0, 1, 1) respectivamente (a unidade de comprimento é 
o metro) com velocidade constante de 1 m/seg. Se um campo elétrico induz 
uma força na partícula dada por 
(1, 1,1) se O<t<l 
(l1, 1, -1) se I<t<?2 
f =< (1, -1, 1} se è 2<«t<3 
(-1, 1, 1) se 3<t<4 
(-1, -1, -1) se t>4 


calcule o trabalho realizado para percorrer esta trajetória uma vez. 


19. Em relação ao produto interno do Exemplo de 8.3.2 calcule x de modo que 


a l1 -l 1 -l 
fa] ângulo entre E l e F 4 tenha uma medida de 90º. 
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*20. Duas pessoas, A e B, fazem a seguinte aposta. A joga uma moeda até que 
apareça cara. Se ela ocorrer na primeira jogada, B pagará 1 ficha; se não 
aparecer cara na primeira e sim na segunda jogada B pagará 2 fichas; se 
ocorrer cara pela primeira vez no terceiro lance, B pagará 4 fichas etc. Em 
geral, se os primeiros n lances forem coroas e o (n + 1}simo lance for 
cara, B pagará 2n fichas, onde n < 5, supondo-se que 5 seja o limite má- 
ximo de lances. Se todos os cinco lances forem coroa, B pagará 50 fichas. 
Antes de começar, A paga a B 5 fichas. Quem levará vantagem neste jogo? 
Quanto A deveria pagar a B no início do jogo para tomá-lo justo? 


*21. Dez pares de observações foram feitas das variáveis X e Y, resultando no 


gráfico abaixo. E 
70 
60 
50 
40 
30 
20 
10 
x 
1 2 3 4 5 6 


Figura 8.9.2 


a) Qual é a correlação entre as duas variáveis? e 
b) Se as unidades do eixo-x fossem 10, 20 etc., qual seria a correlação”? 


*22. A tabela seguinte lista o número de acidentes em veículos motorizados na 


Grande São Paulo em alguns anos entre 1960 e 1978. 


1970 20 800 1429 


Total de acidentes Acidentes por 10 000 veículos 
1960 16 600 1988 


*23. 
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a) Compute a regressão linear de acidentes no tempo. Use-a para prever o 
número de acidentes em 1980. Isto recebe o nome de análise de série 
temporal (i.e. regressão no tempo para prognóstico futuro). 

b) Compute a regressão quadrática do número de acidentes por 10 000 veí- 


culos no tempo. Use esta nova Tegressão para prognosticar o número de 
acidentes em 1980. 


c) Compare estes resultados. Em qual você está propenso a acreditar e 
por quê? 
Sugestão: utilize os resultados de 8.8. 


Os dados abaixo representam a produção de soja durante vários anos em 
um determinado terreno, 


Produção (toneladas) 


Utilizando seus conhecimentos teóricos, experimentais e bom senso, faça 
uma previsão da produção em 1980. 

Supondo-se que a produção é economicamente inviável se for inferior a 66,0 
toneladas anuais, a partir de que ano deveremos mudar a espécie plantada? 
Faça uma crítica da sua proposta. 


Sugestão: utilize os resultados de 8.8. 


8.9.1 Respostas 


' ] l E LE al, o. Alo 
So ese Vere as al 
6. {(-1, 1), (0, 1)) 


10. a) Wi é formado pelos vetores ortogonais a todos os vetores de W. Para 


saber se um vetor está em WŁ é suficiente, porém, que ele seja ortogonal 
aos vetores de uma base de W (por quê?). Achamos então uma base de 
W, obtendo: 


w= [(1,0,0),(0,1, 1)] 
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Portanto Wi = ‘x, y, z) |< (x, y, z), (1,0,0) > =0e <(x, y, 2), 
(0,1,1)> = 0} 
Mas <(x, y, z), (1,0,0)>=x=0 
<(x, y, z), (0,1,1)> = ytz =0 
Assim Wl = {x,y,z lx =0 e y= -z} 
= {(0, -z, z), zE R} 
= {z . (0, -1,1), zER) 
= Io, -1,1)] 


b) Para que ker (T) = Wi devemos ter T(O, -1, 1) = (0, 0, 0). Por outro 
lado para que Im (T) = W cada um dos vetores (1, 0, 0) e (0, 1, 1) deve 
ser imagem. Observando que {(0, -1, 1), (1, 0, 0), (0, 1, 1)) formam 
uma base de R? (por quê?) e que uma transformação linear fica determi- 
nada pelo o que ele faz numa base, podemos escolher T tal que 


T(0, -1, 1) = (0, 0, 0), T(1, 0,0) = (1,0,0)e T(0,1,1) = (0,1,1) 
A seguir achamos a expressão de T(x, y, z). 
13. a) St = [(-1, 1, 1)] 


b} S não é subespaço 
c) S= {[0,0. 1), (1,2, -1)] e St = [(-1, 1, 1)] 


14. a) 7 b) sim c) sim d) não e) não 

Ree ar a 00 A di 
v3 V6 V6 J3 J3 

i aa i aa 

9 VT q VE 1 0 q v3 

16. T= 16 

18. T=10-7V2 

19. x = -15 

20. B leva vantagem. 3,69 fichas. 

21. 0,82 
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TIPOS ESPECIAIS DE 
OPERADORES LINEARES 


9.1 INTRODUÇÃO 


Neste capítulo vamos estudar dois tipos especiais de operadores. Tais operado- 
res são importantes, não apenas pelas propriedades interessantes que eles possu- 
em, mas também por serem os que mais aparecem em aplicações práticas e, 
assim sendo, merecem um estudo um pouco mais apurado. Os operadores auto- 
-adjuntos aparecem naturalmente em problemas que envolvam simetria e em 
outras situações como em Mecânica Quântica, onde estão normalmente associa- 
dos a considerações sobre energia do sistema. Outro tipo de operadores, os or- 
togonais, aparecem na Dinâmica de Corpos Rígidos, ligados a problemas de ro- 
tação e translação. No Capítulo 10 você verá o uso desses operadores no estu- 
do de cônicas e quádricas. 

Iniciamos o estudo desses operadores fazendo algumas observações. 

A primeira delas diz que, ao trabalharmos com base ortonormal, o produ- 
to interno poderá ser expresso numa forma canônica (teorema 9.1.1). As 
outras versarão sobre propriedades de certos tipos especiais de matrizes que 
caracterizarão os operadores a serem estudados. 
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9.1.1 Teorema: Sejam V um espaço vetorial real com produto interno 


(,)e a = (u,,.., Un} base ortonormal de V. Então, se v e w são vetores de 


V com 


bele lwly =| : | temos 


VW =D t Xaya Fo tXyY- 


Em outras palavras, ao trabalharmos com uma base ortonormal, para efe- 
tuar o produto interno de dois vetores basta multiplicar as coordenadas corres- 


pondentes e somar. 


Prova: v=x + Xo2U, +... + XyUn 
e W= yil; + y2 to + Ynn- 
(u, w) = (XU, + + XyUpo Yit t-t Ya Up) 
= (uy +. + Xnlgo YiU) + X10; +.. + Xnlly, you) + 
+ Guy +... + Xyun, Ynn? 


+ 
n n n 

= y x (Wp u) + y xo (Uj, U2) +. + 3 xa (Uj, Up) 
i=l i=1 i=1 


non 
= 3 E Xi); (u, uj). 


j=l i=l 


Mas como (u, u) = i nl 
se iaj, 
os únicos termos não nulos são aqueles onde í = j. Logo, 
(u, W) =X) t XV +. + XnYn- 
A seguir introduziremos as matrizes que estarão associadas aos operadores a 


serem estudados. 


9.1.2 Definição: Seja A uma matriz n x n real e A” sua transposta. 
a) Se A = A! dizemos que A é uma matriz simétrica. 
b) Se A < A' = A' + A = I (ou seja, a inversa de A é A, dizemos que A 


é uma matriz ortogonal. 


No Capítulo 1 já vimos exemplos de matrizes simétricas. Quanto à se- 
gunda definição, as matrizes ortogonais determinam um subconjunto das matri- 
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zes inversíveis. Efetivamente a relação entre matrizes simétricas, inversíveis e 
ortogonais é indicada pela figura abaixo. 


: matrizes 

: matrizes inversíveis 
: matrizes ortogonais 
MS : matrizes simétricas 


555 


È 


Figura 9.1.1. 
Como exemplos de matrizes ortogonais temos: 


Exemplo: 


sen 8 cosê 0 


0 0 1 


cos 6 -sen é 
sen 8 cos 8 


| cos 8 -snf O 
e 


Para verificar isto basta multiplicar cada uma pela sua transposta obtendo 
assim a matriz identidade. Calculando temos, no primeiro caso: 


cos 8 -sen 0 cos ð senô |. 
sen 0 cos 8 -sen O cosê | 
“|co? 0 +sen? 0 O Io 
E 0 sen? 0 + co? 0] 1|0 1 


Observe que a transformação associada à primeira matriz é uma rotação. (Veja 
5.24.) 


Consideremos agora três propriedades das matrizes ortogonais. 


9.1.3 Teorema: Seja A uma matriz ortogonal. Então detA = +1. 


Prova: Como A é ortogonal, A - A' = I. 

Então det(A-A))=detl e (det A) (det A’) = 1 
Mas det A = det A”. 

Assim (det A)? = 1, ou seja, det A = t. 
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9.1.4 Teorema: Uma matriz é ortogonal se e somente se as colunas 
(ou as linhas) são vetores ortonormais. 


Prova: Seja 
GQ di Qin 
aj d P 
A-|? 22 2n 
äni n2 Inn 


Na primeira parte da prova queremos mostrar que se A é ortogonal isto im- 
plica que 


KEPI Gin 


são ortonormais (o mesmo vale para as linhas). Para isto, façamos o produto 
de A pela sua transposta. 


VETI aT ån 41 aia lin 
A -A= = 
Gin Gym En. am 
2 2 1 0... 0 
an +... tam Quan ft... tam 01.0 
Gaai oo o Pr o dbn t.. + ahn g E aei 
pois A'A = I. 
211 
Observamos que af, +... + ai, = l. Mas isto quer dizer que | : é unitário. 
ani 


Da mesma forma, percorrendo a diagonal principal, vemos que cada vetor-co- 
luna da matriz A é unitário. O que encontramos saindo desta diagonal? . O 


elemento na posição i, j (14) é axa; +. + Qnidnj € seu valor deve ser zero. 


arii aij 
Mas isto diz que o produto interno de | : por é nulo, ou seja, os 


ani anj 
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vetores-coluna são dois a dois ortogonais quando i Æ j. 

Está terminada, então a primeira parte da prova. Ainda falta provar que 
se os vetores-coluna (linha) de uma matriz forem ortonormais, a matriz será 
ortogonal. Vamos deixar esta prova para você, já que ela é apenas uma adapta- 
ção da prova dada acima. (Veja o Exercício 4 da secção 9.4.) 

Apresentaremos agora uma situação onde as matrizes ortogonais ocorrem 
naturalmente. 


Exemplo: Seja V = R? e a = {(1, 0), (0, 1)} e B = {(cos 8, -sen 0), 
(sen 8, cos 0)} bases ortonormais. Calculemos a matriz de mudança de base 


[7 i- (Veja 4.7.). Como £ é uma base ortonormal, podemos encontrar as coor- 


denadas dos elementos da base œ em relação a É por meio dos coeficientes de 
Fourier. 
G, 0)= «1, 0), (cos O, -sen 0)) 
> dcos 8, -sen 8), (cos 8, -sen 0) 
«1, 0) (sen 8, cos 0) 
(sen 0, cos 0), (sen 0, cos 8) 


=cos 0 (cos 8, -sen 0) + sen O (sen 0, cos 0) 


(cos 8, -sen 8) + 


y (sen 8, cos 0) = 


Analogamente, 
(0,1) = -sen 8 (cos 8, -sen 8) + cos 8 (sen 0, cos 8) 


Assim 
q |cosf -sen 8 
Uig E É 9º cos s| 


Observe que esta matriz é ortogonal (veja o Exemplo de 9.1.2). Tal resultado 
vale em geral. 


9.1.5 Teorema: Se V é um espaço vetorial com produto interno e q e f 
são bases ortonormais de V, então a matriz de mudança de base u é uma 


matriz ortogonal. 


Prova: Sejam a = {vi, -, Yn} e B= (wi, «o Wa} € 
am sas din 
[lg = 
Eni a lnn 


Biblioteca de 
OA dio 
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Como $ é base, existem números a;; tais que 


Vi =AnW, +... + 2a Wn 


Vn = CnWi ft... tAnnWn 


Mas a é ortonormal e por isso cada v; é unitário. Isto é, 1 = (v;, vp). Além 


disso, 8 é ortonormal e assim podemos encontrar Wi vp multiplicando as coor- 


denadas. (Veja 9.1.1.) Portanto 1 = af; + ... + aZ;. Em outras palavras, cada 
vetor-coluna de Lg é unitário. Mostraremos agora que estes vetores são orto- 
gonais e portanto Lg é ortogonal. (Veja 9.14.) 
Como vw; e vj são ortogonais quando i Æ j, O = tvi, vw) =G1;h;*... +Gnidnj, 

ai aj 
ou seja, e f são ortogonais sempre que i +Æ j. 

Eni Inj 
Assim a afirmação de que Lig é ortogonal é verdadeira. 


Observamos, então, que nesta situação 
né anhy =1, 
ou seja, (BY = (UI), e ainda mais 
R = ug 


Isto facilita o processo seguido para se encontrar uÉ conhecendo [Z i 


onde & e É são bases ortonormais. LÊ é nada mais que a transposta de [7 l5- 


Estamos agora em condições de introduzir os conceitos de operador ortogonal 
e auto-adjunto. 


9.2 OPERADORES AUTO-ADJUNTOS E ORTOGONAIS 


Agora definiremos os operadores associados às matrizes estudadas em 9.1, esta- 


beleceremos relações entre estes e o produto interno e descobriremos as parti- 
cularidades de seus autovalores. Isto nos permitirá chegar a importantes resul- 
tados sobre diagonalização na próxima secção. 


9.2.1 Definição: Seja V um espaço vetorial com produto interno, œ uma 
base ortonormal e T:V > V um operador linear. Então 
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a) T é chamado um operador auto-adjunto se [E é uma matriz simé- 
trica. 
b) T é chamado um operador ortogonal se [riS é uma matriz ortogonal. 


Os operadores auto-adjuntos (ou ortogonais) estão bem definidos no senti- 
do de que o fato de um operador ser auto-adjunto (ou ortogonal) não depende 
da base ortonormal escolhida, isto é, se ITiS for simétrica (ou ortogonal) numa 


determinada base ortonormal «, então [TÊ também será simétrica (ou ortogo- 


B 
nal) para qualquer outra base ortonormal ŝ. Mostremos este fato no caso do 
operador ser auto-adjunto. (O caso ortogonal é demonstrado de maneira simi- 
lar.) 


Sejam a e 8 bases ortonormais e suponhamos que Vas seja simétrica. 
Queremos mostrar que rh também é simétrica, isto é, ary =[TÉ. 


Observamos que 
[78 = (UU re. É 
Também 
Éy = (uêy 
pois œ e ĝ são ortonormais (Veja 9.1.5). Então 
(Th = UÉ- rg- UÉ 
Tomando a transposta temos 
CTB = (By are UÉ 
= (ry - rig tá 
E irh 


pois UÉ = uÉ e FAN é simétrica. 


9.2.2 Exemplos 


Exemplo 1: Consideremos T:R? >R, a rotação de um ângulo 8 em 
torno do eixo-z. Podemos expressar T por: 
Tx, y, z) =(xcos0 - y sen 0, x sen ð + y cosô, z). (Verifique.) 
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Figura 9.2.1 


Tomando a base canônica a e calculando a matriz de T nesta base, temos 


cos 8 -senf O 
Ta =|sen 8 cos 0 O 
0 0 | 


Já vimos que esta matriz é ortogonal e portanto T é um operador ortogonal. 
Exemplo 2: Seja T:R? > R? onde Tx, y) = (2x - 2y, -2x + 5y). 
Se a é a base canônica de R?, a matriz de T é [TiS = E a uma ma- 
triz simétrica, e portanto T é operador auto-adjunto. 
Estudemos agora as propriedades destes operadores. 
9.2.3 Teorema: Seja V um espaço vetorial com produto interno €,) e 


T:V >V linear. Então T auto-adjunto implica que (Tv, w) = (v, Tw) para todo 
vwEr. 


Prova: {caso n = 2) 
Sejam a = (vi, v2) uma base ortonormal, v = X,Vj + yiv € 


w =x% + y2⁄2 ou [v] = *ı e [w], = ra 
& yı a y2 


Como T é auto-adjunto, Iri% é simétrica. 


Seja Ta = ; A 
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k cla bllx| lax tby EE BNA 
Então [va = f | | = E + é e [Tw] -l5 d É = 
Jo + by, 

bx, + cy, 


Assim (Tv, w) = (4x, + by,)x, + (bx, + cr)Y> 
e v, Tw) = xi(ax, t bya) + Vilbx, + cy) e portanto, (Tv, w) = tv, Tw). 


9.2.4 Teorema: Seja T:V >V auto-adjunto e ÀA;, A, autovalores distintos 
de T e v; ev, os autovetores associados a À e A,, respectivamente. Então 
v ly. 
Prova: 
Ar Vi, Vo) = Aivi, vo) = (Ivi, vo) = (vi, Tv) = 
= (vi, Ao vo) = À» (vi ; vV) 


Então (A; - A) tvi, vo) = O. 
Como À - A Æ 0, vem que (vi, v,))=0 ou v l vz. 


As propriedades dadas a seguir são consequências dos resultados anteriores mas 
são tão importantes que as destacaremos numa secção especial. 


9.3 DIAGONALIZAÇÃO DE OPERADORES AUTO-ADJUNTOS E 
CARACTERIZAÇÃO DOS OPERADORES ORTOGONAIS 


O teorema 9.2.4 nos dá uma idéia de que, com relação à diagonalização, os 
operadores auto-adjuntos comportam-se de uma maneira especial. Por exemplo, 
se T:V > V for auto-adjunto, dm V = n e T admitir n autovalores distintos 
(portanto uma base de autovetores), então T é diagonalizável e os autovetores 
são automaticamente dois a dois ortogonais e, após a normalização, podem ser 
transformados em ortonormais. Isto é, T, além de ser diagonalizável, admite 
uma base ortonormal de autovetores. Tal propriedade continua valendo em ge- 
ral e é característica dos operadores auto-adjuntos. Temos assim: 


9.3.1 Teorema: Seja 7:V > V um operador auto-adjunto. Então existe 
uma base ortonormal de autovetores de T. 

Se você está interessado na demonstração desse teorema, siga cuidadosa- 
mente as etapas enunciadas nos Exercícios 10, 11 e 12 da secção 9.4. 
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9.3.2 Exemplos 


Exemplo 1: Seja T:R? >R? o operador linear cuja matriz em relação à 
base canônica é 


-2 0 0 
O 6 I 
O 1 6 
Podemos exibir uma base ortonormal de autovetores para este operador? Inici- 
almente observamos que T é um operador auto-adjunto pois a base canônica é 
ortonormal (em relação ao produto interno canônico) e a matriz é simétrica. O 
teorema 9.3.1 garante, então, a existência de uma base ortonormal de autoveto- 
res. Calculando os autovalores e autovetores associados temos: 

Para A, =-2,w = (1, 0, O); para A) = 7, vz =(0,1, 1) e para As = 5, 
v, = (0, 1, -1). 

Como estes autovetores provêm de autovalores distintos-e T é auto-adjun- 
to, o teorema 9.2.4 garante que eles são ortogonais. Então ((1, O, 0),(0,1, 1), 
(0, 1, -1)) é uma base ortogonal de autovetores. Basta agora normalizá-los para 
obtermos a base procurada: 


(0, 0,75 (0,1, 1), Fe 1, -1)}. 


Exemplo 2: Seja o operador linear T:R? >R? cuja matriz em relação à 
base canônica é 


2 1 l 
2 + 
-1 2 


Exibamos uma base ortonormal de autovetores para este operador. Procedendo 
de modo análogo ao anterior, vemos que T é auto-adjunto e portanto tal base 
existe. Calculando os autovalores e autovetores associados temos: Para A, = 0, 
os autovetores são do tipo (-y, y, y) e o subespaço destes autovetores tem di- 
mensão 1. Para À = 3 os autovetores são do tipo (y +z, y, z) e o subespaço 
associado tem dimensão 2. 

Vamos construir uma base de autovetores escolhendo um autovetor do 
subespaço associado a A = O e dois autovetores LI do subespaço associado a 
A» = 3. Suponhamos que v, = (-1, 1, 1) tenha sido tomado no primeiro subes- 
paço. Como todos os autovetores no segundo são da forma (y +z, y, z), obser- 
vamos que o produto interno de (-1, 1, 1) com qualquer da forma (y + z, y, z) 
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é O. Mas não é garantido que quaisquer dois vetores de (y +z, y, z) são orto- 
gonais, mesmo que sejam LI. Por exemplo, (1, 1, 0) e (1,0, 1) são LI mas 
não ortogonais. Contudo, podemos usar o vetor (1, 1, 0) e procurar outro ve- 
tor do tipo (y +z, y, z) que seja ortogonal a (1, 1, 0), isto é, o produto in- 
terno destes deve ser nulo. Ou seja, 


Vtzty=2y+7=0 ou z=-2y 


Um vetor que satisfaça estas relações deve ser do tipo (-y, y, -2y). Por exem- 
plo (-1, 1, -2). 

Ficamos assim com a base {(-1, 1, 1), (1,1, 0), (-1, 1, -2)) que é for- 
mada de autovetores dois a dois Ortogonais. Normalizando estes vetores temos 
a base procurada: 


1 
(561), Fa. Ë O), zC, 1, -2)} 


Suponhamos que a seja uma base ortonormal qualquer de Ve Ba base 
ortonormal de autovetores dada pelo teorema 9.3.1. Observemos a relação entre 


ITI% e [T], Temos [7]% = mÉ - ug mg = po! - rÉ- [3 e portanto, 


& Qy ; 
Ka = (ig) . ri . a pois a e É são ortonormais. Isto será utilizado na 
classificação das cônicas. 


O teorema seguinte caracteriza as transformações ortogonais. 


9.3.3 Teorema: Seja 7:V >V um operador linear num espaço vetorial V 
com produto interno (,). Então as condições abaixo são equivalentes: 

a) T é ortogonal. 

b) T transforma bases ortonormais em bases ortonormais. Isto É, se 


tvi, -s Yn} é base ortonormal de V, então (Tvi, ..., Tvp} é uma base orto- 
normal. 

c) T preserva o produto interno, isto é, (Tu, Ty) = (u, v). 

d) T preserva a norma, isto é, 1Tvll= lvi. 


Prova: A demonstração é deixada como exercício. 


O item (d) dá uma caracterização geométrica dos operadores ortogonais. 
Estes são, entre os operadores lineares, os que estão associados a movimentos 
rígidos. Por exemplo, se nos restringirmos às transformações lineares do plano 
no plano, estes operadores serão as rotações de um ângulo 0 e as reflexões em 
relação a uma reta pela origem, ou composições delas. 
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8. Mostre que uma transformação ortogonal do plano no plano deixa invariante 


a distância entre dois pontos, i é, dado 
p Isto é i 
, » dados u e v vetores quaisquer do pla- 


, 


9.4 EXERCICIOS 


1. Seja a = (wir, W2, Wa) uma base de V, um espaço vetorial real com pro- 
duto interno (, ). 


(Mu) - Ty) = lu -v] 


2 5 a 
lula = =! | é (p= |? (Sugestão: use o teorema 9.3.3 (d).) 
-3 


9. a) Mo $ ã 
) E pa que se Té uma transformação ortogonal do plano no plano, sua 
atriz em relação à base canônica só pode ser da forma: 


A-|€Sa -sena 
sena cosa 


Se (u, v) = 2, a base & é ortonormal? 


2. Ache valores para x e y tais que É: >] seja uma matriz ortogonal. 


3. Sejam a = {(1, 1), (2, 0)} e B = ((-1, 0), (2, 1)}. A partir das bases a € ou da forma 
ß construa bases ortonormais, usando o método de Gram-Schmidt. Se estas 
novas bases forem a e $' respectivamente, mostre que à matriz de mudança B- fe é “sen d 

de base ig é ortogonal. sen a -cos a 

(Sugestão: 9.3.3 (d).) 


4. Dada uma matriz A cujas colunas são vetores ortonormais, prove que A é 


b) O : i 
ortogona. ) Observe que se a matriz de T for da forma dada por A. T será uma ro- 


tação de um ângulo a (veja 5.2.4.). Mostre que B = A ° J onde J = 


5. Seja T(x, y, z) = (2x +y, x +y +z, y - 3z) de R? em R? com produto 
interno canônico. 
a) Mostre que T é um operador auto-adjunto mas não ortogonal. 
b) Se v = (2, -1, 5) e w = (3, 0, 1), verifique que (Tv, w) = tv, Tw). 
c) Exiba uma base de autovetores de T e verifique que é uma base ortogo- 
nal, A partir desta base, escreva uma base ortonormal. 


I! 0 2 
= É E (J é a matriz em relação à base canônica de reflexão no 


eixo-x. Veja 5.2.2. Conclua finalmente, usando composição de funções 
que se a transtormação T tor dada por B, T será uma reflexão Laos de 
uma reta do plano que passa pela origem. 


q 


10. Sejam V um espaço vetorial real de dimensão n, com produto interno (,) e 


a IEN A * : ; Vos á um operador linear auto-adjunto. Se œ for uma base ortonormal 
. = e V, chamem A a matriz [7] i 
do sa os de A a matriz [ a Consideremos a transformação linear 


T, :C” > 0” 
a) Mostre que os autovalores são: a, b+ceb-c. A >C dada por 
b) Ache uma base de autovetores. 


X; X1 
7. Seja o operador linear T:R? >R? cuja matriz em relação à base canônica é RR 
l 4 2 Xn Fa 
4 -5 -4 ' 
oh d onde x; E€ C (C = conjunto dos números complexos) e o produto interno 


insni n 
canônico em C”, dado por 


Exiba uma base ortonormal de autovetores. tv we = Xii + Xaya ta tão 
Biblioteca de 
Ciência & Tecn 
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xı ya 


para v =|: ew=: (Veja 8.6.) 


Xn Yn 


a) Mostre que Tą tem sempre autovalores. (Sugestão: Lembre-se de que um 
polinômio sempre tem raízes se estivermos trabalhando sobre os números 
complexos.) 

b) Mostre que (Tav, We = (v, Taw)ç para quaisquer v, w € C”. (Sugestão: 
Siga a idéia do teorema 9.2.3.) 

c) Mostre que os autovalores de Ty são necessariamente reais. (Sugestão: 
Chame de À um autovalor de TA com autovetor v. Lembre que para um 
número complexo À ser real, basta que ele seja igual ao seu conjugado. 
Desenvolva então (Tv, V de dois modos distintos, utilizando o item (b) 
e as propriedades de produto interno sobre um espaço vetorial complexo. 
Veja 8.6.) 

d) Mostre que os autovalores de T e Tą são os mesmos. 

e) Utilizando os resultados anteriores, conclua que um operador linear auto- 
-adjunto tem autovalores e eles são necessariamente reais. 


11. Seja V um espaço vetorial real de dimensão n, T:V > V um operador linear 

auto-adjunto e v € V um autovetor de T. 

a) Mostre que fv], o espaço gerado por v, é invariante por aplicação do ope- 
rador T, isto é, se w E [v], então Tw € [v]. 

b) Mostre que [v}}, o complemento ortogonal de [v] (veja 8.5), é invariante 
por aplicação do operador T, isto é, se w E [v], então Tw E [v]" e por- 
tanto T induz um operador linear T; vlt> fv] 

w > Tw 

c) Mostre que o operador T, definido no item (b) é auto-adjunto. 

d) Mostre que todo autovetor w de T, com autovalor ô também é autove- 
tor de T com o mesmo autovalor ô. 


12. Demonstre o teorema 9.3.1, isto é, se T:V > V um operador linear auto-ad- 
junto, então existe uma base ortonormal de autovetores de 7. (Sugestão: 
Faça por indução finita sobre a dimensão de V, utilizando os Exercícios 10 
e 11.) 


13. a) Dê a transformação linear que descreve o movimento rígido que leva o 
segmento de extremos (-6, 2) e (-1, 2) no segmento de extremos (-2, 6) 
e (1, 2) respectivamente. 
b) Mostre que esta transformação é uma rotação e encontre seu ângulo. 


14. a) Use a definição 9.2.1 e o teorema 9.3.1 para mostrar que um operador é 
auto-adjunto se e somente se existir uma base B de vetores ortonormais 


em relação à qual [713 é diagonal. 
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b) Use agora o resultado acima para dar uma caracterização geométrica das 


transformações auto-adjuntas do plano no plano. (Observe que E s|- 


= k J . Ê J e note o efeito geométrico de cada uma destas 


duas últimas matrizes. 
c) Analise separadamente em b) os casos 
ia#+#0 e bo. 
i)a=0 e b0. 
i)a=0 e b=0. 


d) Seja a a base canônica e Ta = E a] 


i) Diagonalize o operador T. (Escolha uma base ortonormal.) 
ii) Interprete geometricamente T usando b). 
iii) Teste sua interpretação geométrica, verificando qual é a imagem por 
T de um quadrado de vértices (0, 0), (1, 1), (0, 2) e (1, 1). 


9.4.1 Respostas 


1. Não, pois<uv>£2:5+(-1).2+3(-3). 


=-1 
tem l dy. L Pie 
3.a = TC T F? (5 5! B {( l, 0), (0, 1)} 
i sir 
a! JÍ Ry a AVR 
JA Ca 


E RR 
O l - 


de [7] não são vetores ortonormais, T não é ortogonal. 


s.(M=|[2 1 r| é simétrica. Logo T é auto-adjunto. Como as colunas 


7. =-9, ` =h3=3 
Vi =(1, -2, -1), do = (1, 0, 1), Va = (1, l; -1) 


get O a ode css. S “Eaj 
9. a) Sejam T =|] i e v = (x, y) qualquer T ortogonal > |IT;y;ll 


268 ÁLGEBRA LINEAR 


= |lv|| etc., escolhendo vários vetores v para gerar um sistema de equações 


que fornece a, b, c e d. 
b) Sugestão: a inclinação da reta pela origem tem inclinação 
(x, y), onde v = (x, y), e mostre que esta imagem é 


de = . Ache a 


imagem do ponto 


exatamente B - [| , ou seja, Ty. 
» 


11. a) w € [v] => 3u € R tal que w = uv. 
Tw = T(uv) = uTv = u» Nv onde À é O autovalor associado a v. Mas 


GMA)v E [v], e portanto Tw € [v]. 

b) Seja w € [v]!. Então < w, v > = 0. 
Como < iw, v > = < w, Tv > pois T é auto-adjunto, € 
Ty = Nv. < Twv >= <w, y >=A<w,y>=0 
Portanto, Tw € [vt 

c) Seja $ = Cn , Va, -, Yn} uma base ortonormal de y. 


Então ĝi = (vz, =s Yn } é uma base de ivit. 


Ui, é simétrica pois T é auto-adjunto e da forma | au 0 0 
0 an Per Gon 
0 a a 
an « an nz zn 
Então [T; lg = é simétrica e Tı é auto-adjunto. 
1 
n2 ai ann 


d) Tw = Tıw, pois w E tvi, e Tw = ôw. 
Então ô é autovalor de T e w um autovetor associado. 


E la b -ja b zels T 

13. Seja IT) = |? è | emão [$ A | s | [5] 
a b -1 | _iL pa Re _ |csa -sena 
Ê AJ | t |= [4] . Logo, [7] = -4 - [me A 
onde a = - arccos $ . 
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FORMAS LINEARES, 
BILINEARES E QUADRÁTICAS 


10.1 FORMAS LINEARES 


Raia que uma pessoa necessite comprar ferro, chumbo e cobre a cinco, seis 
E e cruzeiros o quilo, respectivamente. Se esta pessoa compra x alo: de 
K Ed Ta de chumbo e z quilos de cobre, podemos representar esta com- 
É pelo vetor (x, y, z) e o custo total é dado pela expressão 5x + 6 

bserve que a “função custo” dia 


c:Rº*-—— R 
(x, y, z) — 5x + 6y + 42 
é uma transformação linear (verifique) cujo contra-domínio é um espaço vetorial 


muito j is é j ú i 
or particular, pois é o conjunto dos números reais. Transformações lineares 
ste tipo aparecem muito e por isso recebem um nome especial 


10.1.1 Definição: Seja V um espaço vetori 
: al real, ; á 
uma transformação linear f: V — v E paia ds 
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10.1.2 Exemplos 
Exemplo 1: f:R?—> R 


(x, y) x + y ou na forma matricial 
* de, [1 1] % 
y » 


Exemplo 2: g :R?— R 
(x, y, z) — 2x +t y - z ou na forma matricial 


X x 
roi 
Z Z 


Se f: V— R é uma forma linear, œ = lv,, ., vn) é base de Ve B = 
= (w) é base de R, então 


Vl =[a 4&2 .. Qnlixn- 


Se v E V é tal que 


X1 


[va = 
então LAO], = [Ig Va 


10.2 FORMAS BILINEARES 


Consideremos agora funções, associadas a espaços vetoriais, que se comportam 
mais ou menos como produtos internos, isto é, funções que a cada par de ve- 
tores associam um número de tal forma que uma vez fixado o primeiro vetor, 
a função seja uma forma linear em relação ao segundo vetor, e vice-versa. Fun- 
ções deste tipo estão muito relacionadas com considerações acerca da energia 
de um corpo (veja 10.5) e, portanto, com toda a Física. Nesta secção definire- 
mos estas funções, que serão denominadas formas bilineares, e estudaremos al- 
guns aspectos técnicos, principalmente o seu relacionamento com matrizes, que 
é o mais importante na prática. 
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10.2.1 Definição: Seja V um espaço vetorial real. Uma forma bilinear é 
uma aplicação B:V X V > R definida por (v, w) — B(v, w) tal que: 
i) Para todo w fixado, B(v, w) é uma forma linear em v, isto é, 
B(vi + v2, w) = B(v,, w} + Bí(vo, w) 
e B(av, w) = aB(v, w) 
ii) Para todo v fixado, B(v, w) é uma forma linear em w, isto é, 


B(v, wi + w2) = B(v, wi) + B(v, wz) 
e B(v, aw) = aB(v, w) 


10.2.2 Exemplos 


Exemplo 1: O produto usual de números reais 
p'RXR >R 
(x, y) — pex, y) = xy 
Verificando i) e il): 
p, y +2) =x(y +z) =xy + xz = p(x, y) + p(x, 2) 
plax, y) = ax + y = a(xy) = ap(x, y) 
Analogamente mostram-se as outras propriedades. 


Exemplo 2: B:R? X R? > R dada por 


Bl(x,, Y1): Œ2, Y2)) = X1X2 - 2V1)? 
é bilinear. De fato, 
B((x1, Y1), (xa, Y2) + 3, y3)) = BŒ, Yi), Oo + x3, Y2 + y3)) = 
= xi(x2 + x3) + 2y + Y3) = (xıx2 + 2y1y2) + X1X3 + 2y1y3 = 
= B(x, y1), x2; Y2) + Bœ, y1), (xa. y3)) 


As outras propriedades são verificadas de modo análogo. 


Exemplo 3: Seja V um espaço vetorial com produto interno (,). Podemos 
definir a forma bilinear V X V > R por B(v, w) = (v, w). O fato de B ser 
bilinear é uma conseqüência das propriedades de produto interno. 


Vamos considerar agora um exemplo importante. 


Exemplo 4: 
-2 0 0 
SejaM=|4 2 0 
o 02 
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Podemos associar a M uma forma bilinear B:R? X R? > R definida por 


-2 0 0] |) 
B((x;, X2, X3), Wi, Y2: Y3)) = [xy x2 x3]|4 2 0 Y2| = 
0 0 2 Y3 


= 2X) + 4X) t May, + 2X33 


A bilinearidade de B decorre das propriedades do produto e da soma de matri- 
zes. 


Exemplo 5: Sejam V um espaço vetorial de dimensão n e a uma base de 
V. De modo análogo ao que foi feito no exemplo anterior, dada uma matriz 
qualquer Maxn. podemos associar uma forma bilinear B:V X V > R defini- 
da por: 


se 


Iva =|: | e [wla = 
Xn Yn 
Se B:V X V > Ré uma forma bilinear e dados vı, V2, Wi, W2 em V, 
em geral temos 
B(v, + vz, Wi + w2) É B(vi, Wi) + Blva, w2) 
pois B(v, + vo, Wi + W2) = Blvi, W, t w2) t B2, Wi + w) = 
= B(vi, Wi) + B(vi, W2) + B(v2, Wi) + Blvo, Wa) 
B(v, w) = [va M [W]a 


Observe, ainda, que no Exemplo 4, temos V = R? e a base canônica. A 
seguir veremos que, na verdade, toda forma bilinear pode ser escrita na forma 
do Exemplo 5, dado acima. 


10.3 MATRIZ DE UMA FORMA BILINEAR 


Sejam V um espaço vetorial e B:V X V > R uma forma bilinear. Dada uma 
base a = {v;. ..., Yn} de V, associamos a B uma matriz Bl, chamada matriz 


da forma bilinear B, na base a, do seguinte modo: 
Se v=xV +.. + XpYn € W= yY to + YnYn, n 


Biv, w) = B(xiY, + + XpVas Vivi t. + YnYn) = 5 xi Y;B(vi, Yj) 
i,j 
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B(v,, Yi) B(v,, Vn) Yı 
= [x PRA Xn] 


B(va, vi) PEN B(vn, Vn) Yn 


= [vi Balla 


10.3.1 Exemplos 


Exemplo 1: Seja B:R? X R? >Ra forma bilinear dada por B(v, w) = 
=X), + 2X) + 5x2y2 onde v = (x1, x2) e w = (yı, y2). Então se 
a = {e;, e2} é a base canônica de R?, temos 


[B]º = B(e,.e) Ble,e)| |1 0 
a B(e2, e1) Blea, e)|] 12 5 


Com isto, podemos escrever a forma bilinear dada na forma matricial: 


mam [E 
2 


ou seja, B(v, w) = [v], (Bla [w] 


Exemplo 2: Seja B:R? X R? > R a forma bilinear definida por 
Blix, x2, x3), W1, Y2, Y3)) = 2x, + 4x2y1 + 2x2Y2 + 2x373. Procure- 
mos [Bla onde a = (e;, e2, e3}, é base canônica de R°: 


ä B(e1, e1) B(e1, e2) B(e,, es) 
[B] = B(e,, ei) B(e., e2) B(e,, e3) 
B(es, e1) B(es, e2) B(e3, e3) 


Nesta matriz determinamos, por exemplo, B(e2, e1) = B((0, 1 0), (1, 0. 0)) = 
=-2-0.-ł}+4.-1.-1+2.-1-0+2.0.+.0=4. Calculando os outros 
elementos, obtemos 


-2 0 0 
[Bla =-]4 2 0 
0 0 2 


Compare com o Exemplo 4 de 10.2.2. Como não poderia deixar de ser, 
[B]Š = M. 
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10.4 FORMA BILINEAR SIMÉTRICA 


10.4.1 Definição: A forma bilinear B:V X V — R é simétrica se 
Bv, w) = B(w, v) para todo v, w E V. 


10.4.2 Exemplos 


Exemplo 1. Seja (,) um produto interno em V. Então a forma bilinear 
B(v, w) = (v, w) é simétrica, pois (v, w) = (w, V). 

Exemplo 2: B:R? X R? >R dada por 

B(v, w) = -X1Y1 + 3X) +t 3x1y2 + 2X22 
onde v = (x1, X2) € W = Wi, y2) 
Calculando, B(w, v), temos 
B(w, v) = (W1; Y2), (rr, X2)) 
= ixo + 3y2x1 + 3y2Xı + 2y2%2 

Como B(v, w) = B(w, v), B é simétrica. 

Observe que [BJ& é uma matriz simétrica. De fato: 


B(v, w) = [x, x2] ° Ê 4 , B 


Este resultado vale em geral, podendo ser enunciado no teorema abaixo. 
10.4.3 Teorema: Uma forma bilinear B: V X V —— R é simétrica se e 


somente se [B]Š é uma matriz simétrica. 


Prova: (Veja o Exercício 7 de 10.7.) 


10.5 FORMAS QUADRÁTICAS 


Consideremos uma partícula de massa m deslocando-se no espaço com veloci- 


dade Y = (vx, Yy, Vz). À energia cinética que esse corpo possui é dada pela 
expressão 


2 
E, = DL E (Yvi tos tz) 


2 


Portanto, 
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m 
Ee = Vrts tvi 
m/2 0 Vx 
= |x Vy vz] 0 m/2 0 Yy 
0 O m/2| |» 


Dessa forma, a energia cinética pode ser interpretada como uma função (que 
não é linear) da velocidade. 


Figura 10.5.1 
E:R? >R 


m 24,m 2, mMm 2 
x, Vy, Vz) g t Pa ta" Yy ty “Va 


Se considerarmos, agora, a aplicação bilinear simétrica 
BIR XR? >R 
cuja expressão é 
m2 0 0 Wy 
0 


o 
3 

ama 
N 


B(x, Vy, vz), (wx, Wy, wz)) = [vx Vy vz] 


observamos que 
Ecx, Vy, Yz) = B(x, Yy, vz), (x, Vy, Ve). 
Expressões que se comportam como a da energia cinética, isto é, que pro- 


vêm de formas bilineares simétricas, recebem o nome de formas quadráticas. 
Agora, poderemos formalizar este conceito. 


10.5.1 Definição: Seja V um espaço vetorial real e B: V X V > R uma 
forma bilinear simétrica. A função Q:V — R definida por Q(v) = B(v, v) é 
chamada forma quadrática associada a B. 


Biblioteca de T 
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Observe que (de 10.4.2) em relação a uma base a de V, Q pode ser ex- 


pressa na seguinte forma: 


o(v) = [v] a [BIG va 


onde [BIG é uma matriz simétrica. 


10.5.2 Exemplos 


Exemplo 1: 
QO:R >R 


O(v) = x? - 10xy + y?, onde v = (x, y) 


Sabemos que 


Qv) = [x y] f 


=ax? + 2bxy + cy’. 


Então, ax? + 2bxy + cy? =x? - 10xy + 2. 


Logo, a = 1l, 2b = -10,c = 1 


Substituindo, 


Q(v) = [x y] É 


Observe ainda que Q é a forma quadrática associada à forma bilinear: 


Bi, w) = Ex, 21] É 


] Iva = H e [BIZ = |.s 


onde [v]; = 


(a é a base canônica de R°.) 


O procedimento adotado no exemplo anterior pode ser aplicado a uma 
forma quadrática genérica Q:R? > R, onde Q(x, y) = Ax? + Bxy + Cy?. 


1 
5 


Concluímos então que sua forma matricial é 


Q(x, y) = [x y]. 


A 


B 
2 


il 


tolto 


È 
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Exemplo 2: 
Q :Rº' >R 
Q(x, y, z) = 3x? + 2xy + 4y? + 5yz. 


Em relação à base canônica de R?, Q é dada na seguinte forma matricial: 


3 1 0 x 
5 
O y, z)= [xyz] jl 4 ziy 
5 
0 > 0 Z 


Compare com o exemplo anterior e extraia um resultado análogo para formas 
quadráticas Q:R? > R, 
Q(x, y, 2) = Ax? + By? + Cz? + Dxy + Eyz + Fxz. 


Exemplo 3: 
Q:RÈ >R 
Q(x, y, zZ) = 2x? +y? - 3z? 
2 0 0 x 
=Ixyz]/0 1 0) |y 
0 0 -3 z 


10.6 DIAGONALIZAÇÃO DA FORMA QUADRÁTICA 


Veremos a seguir que qualquer que seja a forma quadrática Q:V > R sempre 
existe uma base ortonormal de V em relação a qual a matriz de Q é diagonal, 

ou seja, Q terá uma forma parecida com a do Exemplo 3 de 10.5.2. Antes de 

formalizar este resultado no teorema 10.6.1, vamos “diagonalizar” a forma qua- 
drática do Exemplo 1 de 10.5.2. O(v) = x? - 10xy + y? onde v = (x, y). Pro- 

curemos uma base f de modo que se 


X 
blg = E 
Q0) = MK + Mi 


ou ainda Qv) = be yil Ê A [| 
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Qx, y) = [x y] E E 


ou Q(x, y) = [vi Bla [vl & base canônica do R?. Como a matriz [B]& é 
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demos 10.6.1 Teorema: Seja Q(v) = B(v, v) uma forma quadrática em V. Existe 


uma base ortonormal 8 de V tal que se 


Ji 
simétrica, ela é diagonalizável, admitindo um conjunto de autovetores ortonor- [vg P 
mais. 
Os autovalores de [B]Š são A = 6 e À = -4. Procurando os autovetores, Yanl, 
encontramos para À; = 6, v; = (x, ix) e para À) =,-4, v2 = (x, x). 


(Verifique.) Assim, uma base ortonormal f de autovetores será dada por 
1 l 


A e apaa a então Q0) = My? t... ti. 
oaa EE e v lJ Ja ntão (v 171 MY 


Prova: Seja œ uma base ortonormal qualquer de V. 

Então Q(v) = B(v, v) = [vlg [B]Š [vly: Logo, a matriz [B]& é uma matriz si- 
métrica e, portanto, corresponde a um operador auto-adjunto T:V > V que 
tem como matriz a = [ea Como um operador auto-adjunto pode ser dia- 


gonalizado mediante uma base É de autovetores ortonormais, então 


Seja uÉ a matriz de mudança de base. Então 


0 
Ba = iÉ (8); Lg. Snäs [É = Ê H 


Substituindo em Q(v) = [Va [Blá [vlw temos 


Ài 0 
r B & ; 
Qv) = lvl; 1 [BIG UG Ma IB)e = TIS = UÊ us 
An 
Como f é ortogonal, pois œ e £ são bases ortonormais, (veja 9.1.5), 0 
Bia -any 
p = g= p l i 
donde ia l i 
00) = (UN; vla) UE (Og ba = (139) f 
' f n 
= [vg 181$ (VIE. 
Isto é, ; $ 
6 0j |x 1 
Q(v) = fx: yıl o q i E (Ig A l ng 
= 6x? - 4y? 0 Àn 
X1 
onde [vlg E E 


pois œ e É são bases ortonormais e, portanto, Ng é uma matriz ortogonal. 
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Então, 
A 0 
Q0) = [la - (UG) a Lg Mla 
0 An 
A 0 
= (g Mo)’ z (Ig la) 
0 Nk 
M 0 
= [Mg E, [lg 
0 Àn 
A 0 Yı 
= a Yn] 
0 An Yn 


= ayi + Ns +... + Anyi. 


10.6.2 Exemplos 
Exemplo 1 Seja a forma quadrática em R? dada por: 


Se v= (x1, X2), 
Q(v) = -4x) - 6xıx, t 6x3 

2 

= -4x7 - 3x1X2 - 3xıX2 t 6x3 


] -4 -3 Xi 
= x, X2 58 6 X2 
Calculemos os autovalores. 
-4-A -3 i 
= = - 2) - 33 
P(A) = det | 3 6 A A 
M=1-V34 e Mņ=l+tvy34 


Então existe uma base 8 (que é aquela de autovetores da matriz) tal que se 
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p= [51] 
1 -V34 0 
Di 


então Av) = Iyi y2] y 
0 1 +V 34 2 


isto é, 
Om = (1-V34yi +(1+ 34 pi; 
Esta diagonalização das formas quadráticas (forma normal) tem muitas 
aplicações e uma delas será vista na classificação das cônicas, que apresentare- 
mos no próximo capítulo. 


10.7 EXERCICIOS 


1. Seja f uma forma linear de R? em R tal que 
fo, y) = -x + 2y 
Sejam « = {(1, -1), (2, 0)} e 8 = {-1} bases de R? e R respectivamente. Se 


Va = E , calcule Volg 


2. Verifique se as aplicações abaixo são formas bilineares. 


a) B:R? X R? >R definida por B((x,, y1), Mo Y2) =X +) 
b)}B:V X V >R definida por B(u, v) = (u, v). 


3. Em 2b) você deve ter mostrado que todo produto interno é uma forma bì- 
linear. A recíproca é verdadeira? 


-1 
4. Se M = E ache a forma bilinear B:R? X R? > R associada à 


matriz M. Esta forma bilinear é simétrica? 


5. Qual é a matriz M,x, associada à forma bilinear de R? X R? -> R que 
dá o produto interno usual de R?? 


6.4) Seja A : R? X R? > R definida por A((x, y, z), (œ, y’, Z’) = xy" + 
+ xz' - yx’ - zy' + zz'. Ache a matriz de A em relação às bases i) canô- 
nica i (1, 1, 1), (1, 1, 0), (0, 1, ©}. 
b) Seja A:R? X R? >R definida por A((x, y), (e, y)D) = xy' -yx e 
a = {(1, 1), (-1, 1)}. Ache [A]. 
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7. Mostre o resultado afirmado em 10.4.2 e use este fato para dar exemplos de 
formas bilineares simétricas B:R5 X R? >R. 


8. a) Seja Al, 3). œ, 3) = 3xx' - yy’. Ache a forma quadrática 
Q:R? > R associada a A. 
b) Seja Q(x, y) = 2x? + 4xy - y?. Ache a matriz da forma bilinear associa- 


da. 


9. Seja Q(x, y} = x? + 12xy - 4y?. Determine uma base $ tal que 


[vlg = E | e Qv) = ax? + byi 


10. Se 4 é uma forma bilinear simétrica e Q a forma quadrática associada a ela, 


mostre que 


Av w = 1 0 + wW) 500 -w) 


11. Uma forma quadrática Q é chamada positiva definida, se para todo 
v #0, O(v) > 0. 
a) Como devem ser os autovalores da matriz de uma forma quadrática posi- 
tiva definida? (Pense na matriz diagonalizada.) 
b) A forma quadrática Q : R? — R dada pela matriz (em relação à base 
canônica) 


é positiva definida? 


12. Mostre que se B(v, w) é uma forma bilinear simétrica cuja forma quadrática 
associada é positiva definida, então B(v, w) é um produto interno. Compare 
com o Exercício 3. 


13. Considere o conjunto V*, formado por todas as formas lineares T:V >R, 


onde V é um espaço vetorial de dimensão n, e V* é chamado de espaço dual 


de V. 

a) Mostre que V* é um espaço vetorial. 

b) Mostre que, dada uma base v,, ..., Yn de V, as formas T;:V — R de- 
finidas por T;(@;) = 0, sei £j e Tivi) = = l, se i =j, formam uma base 
de V*. 


c) Conclua finalmente que V e V* são espaços vetoriais isomorfos. 
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10.7.1 Respostas 


1 E] = (1) 


3. Não, pois B(u, v) £ B(v, u) e o produto interno é comutativo, ou seja, 


(u, v) = tv, u). 


7. Seja [815 simétrica. [83 = ps E onde aj; = aji 


In, - -- nn 
Seja u=l[x,,..., Xn] 
v = [Yi .. n Yn] 


n 


n 
Então B(u, v) s > aij Xj 
i=1 


n 
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n 
e B(v, u) = ba > aijyixj. Como a adição é comutativa e aj; = Gij, temos, 


j=1 i=1 
depois de trocar os índices i e j, 


in 
B(», u) = 22 


Agora, seja B simétrica. Então B(u, v) = B(v, u) 


n 
È dij XjyYi 
i 


aijxiyj = Blu, v)y 


A. 


n 


n 
Daí obtemos L Da GjXYj = 


Im: 


Invocando índices å direita, temos 


n n n n 
3 È aijXiŅj = » 3 XY; 
j=1 


~~, 
ma 
~, 
(i 
pas 
~ 


Como isto é válido para todos os vetores u e v, 


o a aoi 
aj=a e [Bla é simétrica. 
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Exemplo: Seja 


0O 1 0 0 =] 
1 0 2 0 Ọ 
Bj=|0 2 -1 0 0 
0o 0 0 0 0 
-1 0 0 0 3 


Bu, v) = x1Y2 - X1Ys fx t 2X2y3 FX ~ X33 - XsYı + 3xsy 


9. B = (Fs : Fr) (75. 75) . Então [v]g = E 


e Qv) = -8x? + sy) 


CLASSIFICAÇÃO DE 
CÔNICAS E QUÁDRICAS 


11. a) Os autovalores são todos não negativos. 


-3+4] 


b) Não, pois os autovalores são > 
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2 Hoffman, K. e Kunze, R.; Álgebra Linear; Editora Polígono, São Paulo, 1971. 11.1 INTRODUÇÃO 


Neste capítulo estaremos interessados em figuras do plano R? ou do espaço 
Rº, isto é, em conjuntos de pontos no plano ou no espaço, cujas coordenadas 
satisfazem certas propriedades. Por exemplo, o subconjunto 


(e, ER ix+y=1) 


pode ser representado graficamente, como mostra a Figura 11.1.1. 


= {ix vilx+y=1) 


(1,0) 


Figura 11.1.1 
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Outro exemplo é ((x, y, z) E R? :x =2e y = 1} cuja representação 
gráfica é 


Figura 11.1.2 


Estaremos particularmente interessados em estudar subconjuntos de R? da for- 
ma 


S - ((x, y) € R? FC, y) = 0, s., Fux, y) = 0} 
e subconjuntos de R? da forma 
S = {(x, y, z) E€ R? :Fi(x, y, Z) = 0, ..., Fx, y, z) = 0} 


As equações Fi(x, y) = 0,.., Fix, y) = 0 (ou Fix, y, z) = 0, 

Fx, y, Z) = O no caso do espaço R?) são chamadas equações cartesianas da 
figura que o conjunto determina. Observe que estas equações relacionam as 
coordenadas canônicas, isto é, coordenadas em relação à base canônica de R? 
(ou R°). Freqüentemente, dá-se apenas as equações cartesianas da figura. 


11.1.1 Exemplos 


Exemplo 1: Podemos desenhar a figura no plano cuja equação cartesiana 
(em relação à base canônica) é y - x? = 0. 

A figura pedida é o subconjunto S = {(x, y} € R? :y - x? = 0}, consti- 
tuído pelos pontos do plano, da forma (x, x?). Portanto, 


y 


Figura 11.1.3 
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Exemplo 2: Para desenhar a figura no espaço cuja equação cartesiana é 
y - x? = 0, devemos saber que a figura pedida é o subconjunto 
S = {(x, y, Z E R? :y =x? }. Note que z pode assumir qualquer valor. 


z d 
2 | 
Ng Í 


Figura 11.1.4 


Observe ainda que as equações cartesianas dos dois exemplos anteriores são 
aparentemente as mesmas. 

Analisemos agora o que acontece quando as equações cartesianas são de 
tipos especiais. Comecemos com o tipo mais simples, ou seja, as equações 
F(x, y) = 0 (ou F(x, y, z} = 0), de primeiro grau. 


11.2 RETAS NO PLANO 


11.2.1 Definição: Uma reta no plano é o conjunto dos pontos (x, y} do 
plano cujas coordenadas em relação à base canônica satisfazem a equação car- 
tesiana 


Ax + By=C 
onde 4 + O ou B + 0. Temos as seguintes possibilidades: 


y 
(0, C/B} 
) A+#0eB#0, Ax+tBy=C 
(C/A, O) 
Figura 11.2.1 
y 
ii) A =0e B +0; By=C 
to, C/8) 
x 
Figura 11.2.2 
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ii) A+#0eB=0 vi 
Ax=C 


Figura 11.2.3 


— 
(C/A, 0) Cad 


11.3 PLANOS NO ESPAÇO 


11.3.1 Definição: Um piano no espaço é o conjunto dos pontos (x, y, z) 
do espaço cujas coordenadas em relação à base canônica satisfazem à equação 


Ax+By+tCz+D=0 
onde 4 00uB£0ouC+o0. 


É claro que esta definição algébrica deve coincidir com a definição geo- 
métrica de plano. Consideremos um ponto qualquer (xo, Yo, Zo) tal que 
Axo + Byo + Czo + D = O (sempre exista). Então a equação Ax + By + Cz + 
+ D = 0 pode ser escrita, subtraindo-se a primeira da segunda, 


0 = A(x - xo) + BO - yo) + CC - zo) 
= (4, B, C), (x - Xo, Y - Yos Z - Zo) 
onde (, ) representa o produto interno canônico em Rº. Os pontos (x, y, Z) 
que satisfazem a equação são (x, y, z), de tal modo que o vetor diferença 
v = (x - Xo, Y ~ Yo, Z - Zo) seja ortogonal ao vetor (4, B, C). (Veja a Figura 
11.3.1.) Isto corresponde à definição geométrica de um plano que passa pelo 
ponto (Xo, Yo, Zo) e tem (4, B, C) como vetor normal. 


(xo, Yo, zo) 


Figura 11.3.1 


Passemos agora a analisar o que acontece quando a equação cartesiana é 
de segundo grau. 
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11.4 CÔNICAS NO PLANO 


Para tratar das cônicas no plano de forma adequada procederemos estudando 
figuras padrão e, através da diagonalização de formas quadráticas associadas, 

mostraremos que as equações representam uma das figuras padrão centrada, 

possivelmente, em outro referencial. 


11.4.1 Definição: Uma cônica em R? é um conjunto de pontos cujas 
coordenadas em relação à base canônica satisfazem a equação: 


Ax? + Bxy + Cy? + Dx +t Ey+tF=0 
onde 4 ou B ou C Æ Q. 


Observe que a equação da cônica envolve uma forma quadrática, Q(x, y) = 
= Ax? + Bxy + Cy”, uma forma linear, L(x, y) = Dx + Ey, e um termo cons- 
tante F. Isto é, a equação que define a cônica é: 


Qx, y) + Læ, y) +F=0 


11.4.2 Exemplos 


Circunferência 
A=C=l 
B=D=E=0 
F=-r 

Elipse 
x? 2 
J +gel 
isti ope ushri 
Tæ’ = pose , 
B=D=E=0 
F=-1 
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Uma reta (parábola degenerada) 


Hipérbole 
2 2 y 
Edo 
x =0 
— 
Aa Css OD DO i 
aa a? É) RE: b? >a > 

B-D=E=0 

F=-] 
Parábola Um ponto (elipse degenerada) 


Temos ainda os casos chamados degenerados Vazio (elipse ou parábola degenerada) 


Par de retas concorrentes (hipérbole degenerada) 


Y 


As equações das cônicas aqui apresentadas estão na “forma reduzida”, 
isto é, B = 0; æ A + 0, D = 0 e se C + 0, E = 0. Veremos a seguir, através 
de uma mudança de referencial conveniente, que toda cônica toma uma das 
formas colocadas acima. 

Estamos interessados aqui nas cônicas, definidas algebricamente. No en- 
tanto, cada cônica pode ser perfeitamente caracterizada por propriedades geo- 
métricas (por exemplo, a elipse é o lugar dos pontos do plano cuja soma das 
distâncias a dois pontos fixos (focos) é uma constante). O tratamento geomé- 
trico das cônicas que é a forma como elas foram introduzidas pelos gregos será 
dado em 11.7. O estudo das cônicas feito a partir de suas propriedades geomé- 
tricas é muito bonito e tem muitas aplicações. Vale a pena ver! 
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Então os autovalores são O e 4. 


22 0 1 
Para À, = 0, É | [>] = HE vi JE) 


11.4.3 Exemplos 
Exemplo 1: 2x? - 5)? -7=0 


2x? -5 =7 
2x? 5y? o CER 2 2 X = 4x E 1 i 
— -1 ra À» lego 02] | er ay ond =D 
ES A 1 
7 7 
i Sabemos de 10.6.1 que nesta nova base de autovetores 8 = (vi, vz}, a forma 
R E quadrática 
x y 
——— - —— = ], que é uma hipérbole 
VA Be ow = eyl] 3 >|“ | onde tv, =|” 
2 5 2 2|] y| 0E ajy 
Exemplo 2: x? +y? -6x-2y+t8=0 se reduz a 


œ -3 +0-1}=2 
xt tyi =2 ER 


Q(v) = [x1 yıl É J [| se [vlg bai É | 
1 t 


30 Passo: Agora precisamos determinar a relação que existe entre H e H 
» 


onde x; =x-3 e 
Pis d circunferência de raio V/Z e centro (3, 1). 


Consideremos agora um exemplo mais complicado. ʻi 


e substituir o resultado na parte linear da equação dada. 
Exemplo 3: 
Dada a equação na base canônica œ de R?: 
2x? + 2y? +4xp +4V 2x + 12/2y-8=0 


nosso objetivo, mais uma vez, será determinar que figura esta cônica representa 
no plano. Para isto, precisamos inicialmente eliminar os termos mistos, do tipo 
xy, através da diagonalização da forma quadrática. 


L(y) = [4/2 12v7) [>| 


a: 5 F pz) Futovetores Di] 
y canônica Yı 


1º Passo: Escrevendo a equação anterior na forma matricial, temos 


E A |+ava 1242] [2]-8=0 


x 
Y 
20 Passo: Vamos calcular os autovalores e os autovetores ortonormais da ma- 
f2 2 
Z 
tri [3 i 


PO) = E: sa J= 02-47 -S=-A+A 


40 Passo: A equação original se reduz a 


Yı 


feio o G 
[x nifo Ea +V 12031] “2 A 
77 
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Oxi + 41 +VII +) + 127 (5% +77) -8=0 
4y} - 4x, + 4y, + 12x; +12), -8=0 

4y? + 8x, + 167 -8=0 

y? +t 2x +47 -2=0 


Esta última equação representa a cônica em relação ao novo referencial forma- 
do pelas retas suporte de v; e vz, como mostra a Figura 11.4.1. 


Figura 11.4.1 


Vamos ainda introduzir uma nova mudança de coordenadas para identificar a 
cônica. Ela será dada por uma translação do referencial acima. 


59 Passo: Para “eliminar” os termos lineares onde isto é possível (A + 0), agru- 
pamos os termos de y + 2x, + 4y, - 2 = O convenientemente. 


Q? + 4y, +49)-4+2x, -2=0 
Y, +2} + 2x, -3)=0 


Tornando x, = x; - 3 e y2 =), + 2, obtemos y} + 2x, - 6 = 0 ou finalmente 


l 
E Ud 


Assim, a equação acima representa a cônica em relação a um novo refe- 
rencial R3, obtido por translação e podemos finalmente identificá-la como 
sendo uma parábola, conforme indica a Figura 11.4.2. (Veja 11.4.2 iv.) A ori- 
gem deste último referencial R} será x, = 0 e y2 =0,istoé,x, -3=0€ 
yı +t2=0. 
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Y2 


Figura 11.4.2 
Agora iremos formular o procedimento geral de classificação das cônicas, 
estabelecendo em defalhes o que deve ser feito em cada passo. 
11.4.4 Procedimento Geral de Classificação das Cônicas: Dada a equação 
(em coordenadas canônicas de R?) 
Ax? + Bxy + Cy? + Dx + Ey + F = Q (A ou B ou C # 0), 
para achar que figura ela representa no plano, devemos proceder do seguinte 


modo: 


1º Passo: Escrevemos a equação na forma matricial: 


A 2 
Rolo ? BRZIH 
2 c 


2º Passo: Diagonalizamos a forma quadrática para eliminar os termos mistos. 
Para isto, precisamos encontrar os autovalores A, e À, e os autovetores orto- 


ty 


normais v; e v; de 


njw a 
a njw 


3º Passo: Obtemos as novas coordenadas. Para isto, precisamos para substituir 


na equação de 
X | [z] autovetores | X, 
y canônica Yı 
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40 Passo: Substituimos as novas coordenadas na equação, obtendo a equação 
na nova base (vi, V2} 


` 0 Xı autovetores | X1 _ 
EAI J teto a [| +F-0 


ou seja, Mx? + Myt tax, + by + F = 0 


50 Passo: Eliminamos os termos lineares das coordenadas cujos autovalores são 
não nulos. Temos então três casos: 


Ð MeMO 
Mx tam tvi tb tF=0 
ELE a A Do murado 
18% To? -AN 201 + 5) CU: = 


; b 2 
Seja x, =X + A e y =y t T’ temos então Ax + Ay2 +f=0 
(que é uma das equações típicas) onde 

a? b? 
Eca ia 
ii) Aa +0ec hM =0. 
Ax? +axı tby tF=0 


Alea +) É vim A EO 
ON q SS 


Tornando x, =X + =% e y2 = yı, temos 
2M 
AX tby tÍf=0 


(que é uma das equações típicas) onde 


q? 


4i 
ii) M = 0 eñ #0. (similar ao anterior) 
Como vimos, este procedimento permite-nos, através de uma mudança de 


referencial, colocar qualquer cônica na forma de uma das equações típicas 
(11.4.2). Neste processo classificamos a cônica, damos suas dimensões e posi- 


f=F- 


ções no plano. 


estaremos interessados apenas em classi- 


11.4.5 Muitas vezes, entretanto, 
Bxy + Cy? + Dx + Ey+F=0, 


ficar a cônica dada por uma equação Ax? + 
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sem et . 

d erminar suas dimensões e localização V isando solucionar este pr oblema 
Im: p Š 1$c q y 

de uma fo a mais Ta ida vamos d scut o e os em fun 


Consideremos, portanto, os autovalores À, e A» de Como já 


no a 
n nj 


vimos, obteremos depois da eliminação do termo misto uma equação da forma 


(1) Vamos analisar inicialmente, a situação em que A Æ O e A, Æ 0. Neste 
caso, através de uma translação que é feita no 5º passo de 11.4.4 obtenos 


Aix? + Ayi + f= 
Note que se: 


i) A e À; forem ambos positivos, teremos para f < O uma elipse; para 


J = O teremos um ponto (x 
2=),=0 j 
vazio (compare com 11.4.2), E T EN 


ii) Se^ e À, forem ambos negativos, também teremos uma elipse, um 
E e Ea vazio, conforme f seja positivo, nulo ou negativo. 
1 È Àz tiverem sinais opostos, poderemos ter uma hipérbole, quand 
f + 0, ou um par de retas concorrentes se f = 0. baii 


(IT) Consideremos agora a situaçã 
) ) ção em que À, = O (e, portanto À 
Como vimos, partindo da equação (*), chegamos a uma pa do 
Ayh tax, +f=0 
Note que: 
i) sea + O teremos uma parábola. 


ii) sea = 
) n 0, o ter um par de retas paralelas, uma reta ou o vazio 
alise em função dos valores de f, em que situações isto ocorre) 


(III) O caso em que àz = O é discutido de maneira análoga ao (II). 


P 1 z 
odemos resumir os resultados até aqui obtidos no seguinte teorema: 


t Bx Cy Dx t Ey ł = 0. Sej os V 1 
t i ! Jam Ai e À2 auto alores associados 
i) Se A: há A, > 0 esta qua į 
e ção representa uma e õ 
( s Ra p! lipse, ou suas degenerações 
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ii) Se + A < O esta equação representa uma hipérbole ou sua degenera- 
ção (par de retas concorrentes). 

iii) Se A + A, = O esta equação representa uma parábola ou suas degenera- 
ções (par de retas paralelas, uma reta ou O vazio). 


Podemos afirmar que o determinante associado à forma quadrática 


A 


" é igual ao produto de seus autovalores A; « àz. (Veja o Exercício 
E3 


O nj 


2 
7 de 7.5). Assim o sinal de À * À é o mesmo de (E - AC), que por sua 


vez tem o mesmo sinal de - (B? - 44C). Podemos assim reescrever o teorema 
anterior em função do “discriminante” B? - 44€. 


11.4.7 Teorema: Dada a equação: Ax? + Bxy + Cy? + Dx + Ey + F=0, 
esta equação no plano representará: 


i) uma elipse ou suas degenerações, se B? - 4AC< 0 
ii) uma parábola ou suas degenerações, se B? -44C = 0 
if) uma hipérbole, se B? - 44C > 0 


11.5 QUÁDRICAS EM Rº 


11.5.1 Definição: Uma quádrica em R? é um conjunto de pontos cujas 
coordenadas em relação à base canônica satisfazem a equação: 


Ax? + By? + Cz? + Dxy + Eyz + Fxz + Gx + Hy tlizł+J=0. 
com A ou B ou Cou D w E ou FÆ0. 


11.5.2 Exemplos 


E- 


Elipsóide 
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Hiperbolóide de uma folha 


z 
y 
x 


Hiperbolóide de duas folhas 
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Parabolóide hiperbólico b) Cilindro hiperbólico 


Cone quadrático 


A 


Cilindro 
Se nenhum termo com z aparece na equação da quádrica, temos O cilin- 


dro. O cilindro “padrão” é formado por retas ortogonais ao plano z = O que 
passam por uma cônica neste plano. Por exemplo: 
a) Cilindro elíptico 


c) Cilindro parabólico 


4 z 

4 Y 

| 
É XxX 


A equação que define a quádrica pode representar o conjunto vazio 
(x? = -1), um ponto (x? + y? + 2? = 0), uma reta (x? + y? = 0), um plano 
(z? = 0), dois planos paralelos (z? = 1) ou dois planos que se interceptam 
(xy `= 0). Estes casos são denominados degenerados. Da mesma forma que foi 
feito para cônica, mostramos através de uma mudança de referencial convenien- 
te que toda quádrica é de um dos tipos descritos em 11.2.1. Ou seja, quando 
nos é dada uma equação do 2º grau em x, y, Z, e precisamos saber que figura 
ela representa em R? (classificar a quádrica) procedemos de modo análogo à 
situação em R?, reduzindo a equação e interpretando-a no final. 
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11.5.3 Exemplos 


Exemplo 1: Para classificar a quádrica 
-x? + 2yz +z - y = 100. 


escrevemos a equação acima na forma matricial, obtendo: 


-1 0 0 x x 
x y z|o O 1]jyi+io -1 1]]y|=100 
o 1 01]|2z z 


Calculando os autovalores e os autovetores já normalizados da matriz 


-1 0 0 
0 01 
0O 1 0 
obtemos: 
l 1 
paraM = -1; v, = (1, 0, 0) e vz =(0, 7. 5)8 


l 1 
para M = l; V3 =(0, F A? 


Temos ainda 


x 1 
autovetores 
y = [ ) os 1 
canônica 
z |an. VA 1 aut. 
onde 
l 0 0 
autovetores _ 0 1 1 
canônica JZ J2 
0 1 l 
“Ma V3 


Então, a equação da quádrica em relação a o referencial dado pelos autovetores 


será: 
-1 0 0|| x, l E : PS 
fx y zll o -1 Ollyxl|+fo -1 1)/0 + All» 
0 0 1 Zi k z; 
o-L L 
vV? J2 
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Isto é, 
2.042 2 2. 
-xi -yi tzi “VA = 100. 


Faremos agora uma nova mudança de coordenadas para eliminar os ter- 
mos lineares onde isto é possível. 


| 
zi -x -0i rr +5-100-0 


E 1 
Seja x) =X1,), =) + Vz e Z2 = Z; assim, temos a seguinte equação: 


x? 2 z? 
-Ao T Ao, * A99 l 
AA 2 iu AQ AL 
( 3) ( 3) ( 3 P 


que representa a quádrica em relação ao referencial obtido por translação a 


partir daquele dos autovetores, cuja origem é dada por x, = 0, ya =0ez, 
= 0. Então 


2,50; 4780 PRE ES, 


Comparando a equação obtida com as equações das quadráticas indicadas em 
üi de 11.2.1 vemos que esta quádrica é um Aiperbolóide de duas folhas. 


Biblioteca de ç 
Ciência & Tecnolõo 
a ipa a 
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Exemplo 2: Para achar a figura dada pela equação 
2x? + 2y? + 2z? + 2xy + 2x2 + 2yz = 81 


devemos resolver 


2 1-1 x 
e y zļļ1 2 41468] 
1 2 Z 


7 v2 
A =l, v (20 
V6 vE [v6 
BeN ane gr 
V3 v3 v3 
de dade Dia E E 
Ainda, 
E autovetores a 
y =) nônica 1 
z e Z1 | autovetores 
J2 Æ B 
2 6 3 
autovetores -| V3 s6 HB3 
onde [1] canônica 2 6 3 
-V6 J3 
mo E Cao 


Então, a equação se torna 


1 0 0 1]x; 
[x Yı Zi] 0 1 0 Yi = 81 
0 0 4 Zi 


ou x? + y? + 4z? = 81, que é um elipsóide. 
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Como não aparecem os termos lineares, se não estivermos interessados na 
posição dos novos eixos mas apenas no formato da figura, bastaria calcular os 
autovalores, escrever a equação x? + y? + 47] = 81 e já teríamos identificado 
a quádrica. 

Também no estudo das quádricas em geral, se tivermos problemas onde 
somente a classificação destas seja importante, não interessando suas dimensões 
ou posição no espaço, poderemos resolvê-los apenas estudando os sinais dos 
autovalores associados à forma quadrática. Seria muito interessante que você 
discutisse todas as possibilidades, de modo análogo ao que foi feito em 11.4.5 
para cônicas. 


11.6 EXERCICIOS 

Identifique a figura e ache sua posição quando a sua equação é: 
1. 3x? + 2xy + 3y? -V2x=0 

2. 4x? + 4xp ty? -x=0 

3.xy+żxty=0 

4.x? +xp+72-3=0 

5, 3x? - 4V3 xy - y? + 20y -25=0 

6. 4xy + 3y? + 2V5 x + 4V5y =0 


7. -5y? + 2xy - 8xz + 2yz = 0 
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8. y? +27! + 2/3 yz = 0 


307 

2 
à k A 5. Hipérbole: x? - 22 
9. 9x” + 16y% + 257º + 24xy - 40x + 30y = O 


e l em relação ao referencial com centro no ponto 
3 
Identifique a figura. Não é necessário dar a posição. 


si 5 a den NEN 1 RESPE 
pe El e sinos à na direção de (- a 9) Ea na direção 

2 2 2 _ 1 y3 

10. 3x? + 2y? + 3z? + 2xz =2 (5 


O E 
11.72 +22? + 2V3 yz =0 


11.6.1 Respostas 


2 2 
i . X2 y2 
1. Elipse: Fota 


= | em relação ao referencial de centro no ponto = , = ) 
2 8V2 ' 8v2 
64 32 


e eixos x, na direção de ( Ei A J: ) e y, na direção de (- e A ). 
7. Hiperbolóide de 2 folhas de equação -3x] - 6y? + 47] = 1 em relação ao 
referencial, com centro no ponto (0, O, 0) e eixos x, na direção de 
d l Lly direção (==, - —, Je z, na direção d 
CO ve J dy na reç Ve? VE SE Z, na direção de 
C—,0, =) 
2" E] Va dá 


2 2 
3. Hipérbole: > -72 


Zz fi 
FF 1 em relação ao referencial de centro no ponto x1 
Yı 
z ARAH 1 1 AAAS 
(x1, y1) = (- V2 , 0) e eixos x, na direção de T E) e yı na direção de ia NA 
( = Cas E, o S ) 
VTN 


9. Elipsóide de equação 125x2 + 1253 + 10673 = 3125 em relação ao refe- 


tencial, com centro no ponto (x1, Y1» Z1) = (0,- > » 0) e eixos x, na 
direção de (0, O, 1), y2 na direção de Š ; $ , 0) e z, na direção de 

4 3 
E ge 
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*11.7 PROPRIEDADES GEOMÉTRICAS DAS CÔNICAS 


Figura 11.7.1 


As cônicas, ou secções cônicas, foram estudadas pelos gregos e desenvol- 
vidas a partir das suas propriedades geométricas. Muitos resultados aparecem 
resumidos nos trabalhos de Apollonius (260-170 A.C). 

Para apresentar estas propriedades e definir as cônicas a partir delas vamos 
estudar alguns pontos e retas especiais. 

Consideremos as cônicas na forma padrão: 

2 
E a = 1 (elipse) (E) 


a? 


2 
X 2a 
= a = 1 (hipérbole) (H) 


y? = 4x (parábola) (P) 


1 


Suponhamos ainda a > b > 0. 

Para a elipse e a hipérbole, definimos os pontos: F, (-c, 0) e Fy(c, 0) 
denominamos focos à esquerda e à direita. 

Na elipse tomamos a distância focal c = Va? - b? e para a hipérbole 
c=Val + b. 

Na parábola definimos o foco como sendo F(a, O}; ie c =a 
(veja 11.7.1): 
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X=-8 
e e Figura 11.7.2 
ne : : a c 
A excentricidade e é definida pela relação e A 


Então, O Se < 1 para uma elipse (e = O para a circunferência); e > 1 
para a hipérbole e e = 1 para a parábola. 
As diretrizes da elipse E ou da hipérbole H são as retas: 


a a 
dia € xg 

(O círculo não tem diretriz.) 

A diretriz da parábola P é única e é a reta x = 

= na T ou hipérbole tivermos b > «, a sá focal fica sendo 


c =V b? - a? ec =FvVa +t b? , respectivamente, e os focos Fi(0, -c) e 


c id b 
F,(0,c). A extremidade passa a ser e -=peas diretrizes y = £ PE 


11.7.2 Exercícios 


1. Esboce o gráfico das cônicas a seguir, determinando seus focos, diretrizes e 
excentricidade. Observe depois o papel geométrico da excentricidade. 


a) x? + 4y? = 100 q ty 
b) 2x? + y? = 100 de 100 
E f) x? - 2y? = 100 
Elis tg 
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2 2 


x 
955" k) y? = 4x 
2 
me -yi D y? = 16x 
E n m) 3x? - 4y? = 0 
; -İ 
Ny = 5 


2. Determine as cônicas representadas pelas equações abaixo, encontrando 
também os seus focos, diretrizes e excentricidade. 


a) 25x? + 9y? - 72y - 81=0 
b) 9x - 18y? + 54x - 36 =0 
c) x = 4y? - 16y + [6 


3. Dê as equações da elipse, parábola e hipérbole “centradas” em um ponto 
P(m, n) do plano e com eixos paralelos aos eixos coordenados. Encontre 


também os seus focos, diretrizes e excentricidade. 


4. Mostre que qualquer que seja o ponto F(x, y) sobre a elipse dada no 


exercício lc, a soma das distâncias deste ponto aos dois focos é igual a 10. 


Podemos agora estabelecer as propriedades geométricas das cônicas. 


11.7.3 
. Elipse 2. Hipérbole 


pn 


a 


Fi Fa 


d(P, Fi) + d(P, F3) = 2a 


d(F,, P) -dF,,P) = 2a 
d(F;, Q) - d(F2, Q) = -2a 


P 


3. 
d(F, P) = ed(P, 8) 


na parábola F4 
c=1:- 


d(F, P) = d(P,8) 
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11.7.4 Teorema: Considere uma cônica padrão (E), (H) ou (P) de excen- 
tricidade e. Então: 


1)Se 0 <e < (elipse), então para todo ponto da cônica, a soma das 
distâncias deste aos focos tem o mesmo valor 2a (Fig. 1). 

2) Se e > 1 (hipérbole), então para todo o ponto da cônica a diferença 
das distâncias deste aos dois focos tem o mesmo valor absoluto 
(Fig. 2). 

3) Se e + O, então para todo ponto sobre a cônica, a distância deste ao 
foco é igual a e vezes a distância deste à diretriz. (Focos direitos com 
diretrizes direitas, focos esquerdos com diretrizes esquerdas. Fig. 3.) 


Além disto, o que é fundamental é que cada uma destas propriedades 
caracteriza as cônicas, isto é, 1') um conjunto de pontos do plano que satisfaça 
a propriedade (Z) será uma elipse dada pela equação (E), em relação a algum 
referencial; 2 um conjunto de pontos que verifique a propriedade (2) será 
uma hipérbole (H) e 3) um conjunto de pontos do plano que satisfaça (3) 
será uma cônica, que satisfará (E) (H) ou (P). 

Assim, como subproduto desta proposição podemos dar as definições 
geométricas das cônicas: 


Corolário 1: A elipse pode ser definida como o conjunto dos pontos do 
plano cuja soma das distâncias a dois pontos fixos (focos) é igual a uma cons- 
tante. 

Note que esta constante será igual a medida do eixo maior da elipse. 
Por quê? 


Exemplo: Encontre a equação da elipse de focos em (0, 0) e (0, 8) e 
eixo maior medindo 5, 

Deixamos agora espaço para você: 
i) Definir hipérbole pela propriedade 2. 


ii) Definir parábola pela propriedade 3. 


Corolário 2: 


Exemplo: 


Corolário 3: 


Exemplo: 
Finalmente dê a definição geral (geométrica) de cônica, pela propriedade 3. 


Bibliote 
Ciência 8 
u n mm 
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Corolário 4: 


Discuta e. 

A demonstração da proposição 11.7.4. (ou dos corolários que ela engloba, 
inclusive os que você enunciou) é feita a partir do cálculo das distâncias. 
Tente fazê-las! 


11.7.5 Exercícios 


1. Se você fosse jardineiro e quizesse arrumar canteiros elípticos como faria? 


3 


Volte ao exercício 4 de 11.7.2. O que observa? 


bei 


Encontre a equação da elipse com focos em (-1, 0) e (5, 0) e semi-eixo 


maior 2V3. 


4. Encontre a equação da elipse com focos em (0, 0), (0, 10) e semi-eixo 


maior 5V 5. 
5, Encontre a equação da elipse com centro em (1, -1), semi-eixo maior 6, 


xo 2 als f i 
excentricidade e =7 e semi-eixo maior vertical. 


6. Encontre a equação da hipérbole com focos em (0, 0) e (6,0) e e +. 


7. Encontre a equação da hipérbole com focos em (0, -3) e (0, 5) e um vértice 


em (0,1 + 10 ). 

8. Encontre a equação da parábola com vértice em (2, 1) e diretriz x = 0. 

9. Três postos de escuta estão localizados nos pontos A(O, 0), B0, 4) e 
a% , 0), sendo a unidade 1 quilômetro. Os microfones localizados nestes 
pontos mostram que um revólver estás km mais próximo de 4 do que de 


C eZ km mais próximo de B do que de A. Localize a posição do revólver. 


(A resolução deste problema lhe dará idéia, por exemplo, de como se loca- 
liza o epicentro de um terremoto. São sempre necessários os dados de três 
observatórios sísmicos.) 


l Para consultas veja Leithold, L. O Cálculo com Geometria Analítica, volume 1, 
HARBRA, São Paulo, 1977, p. 491 e 497, ou Bers, L. Calculus, Holt, Rinehart and 
Winston, Inc., New York, 1967. 
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10. Encontre as retas tangentes às cônicas abaixo nos pontos indicados (use 
derivação implícita). 


l 
a) 9%? = x em (1,3) c) 25x? - X° = 100 em (-3, 5, 5) 


b) x? + 25y? = 100 em (6,5) d) y? = 25x em (9, -15) 


11. Cônicas em Coordenadas Polares 
Usando coordenadas polares (r, 8) no plano (x = r cos0, y =rsen8) 
e a definição de cônica dada por 11.7.4, parte 3, você pode deduzir de 
modo simples as equações polares das cônicas, tomando o pólo num foco 
e o eixo polar e sua extensão ao longo do eixo principal’. 
a) Mostre que nestas condições a equação polar das cônicas é dada por 


ed 


r = 
1 + ecos? 


(O sinal + ou - é dado conforme a diretriz correspondente ao foco no 
pólo esteja à esquerda ou à direita deste.) 

b} Dê exemplos de elipses, parábolas e hipérboles com suas formas polares. 
c) Um cometa está se movendo em uma órbita parabólica em torno do so! 
no foco F da parábola, Faz-se uma observação do cometa quando ele 

está no ponto P; a 15 milhões de quilômetros do Sol; uma segunda ob- 
servação é feita quando ele está no ponto P, a 5 milhões de quilômetros 
do Sol. 
Os segmentos de reta FP, e FP, são perpendiculares. Com estas informa- 
ções há duas órbitas possíveis para o cometa. Encontre a distância mais 
próxima que o cometa passa do Sol, em cada órbita. 

d) A órbita do planeta Mercúrio em torno do Sol é elíptica, com o Sol em 
um dos focos, tendo o semi-eixo maior 36 milhões de quilômetros e ex- 
centricidade 0,206. Encontre: (a) qual é a distância mais próxima que 


PARR passa do Sol e (b) a maior distância possível entre Mercúrio e O 
ol. 


12. Equações Paramétricas da Elipse 


a) Mostre que as equações paramétricas x = acostey=bsent,a>0 
b>0e0< ne 27 definem uma elipse cuja equação em chordenadas 
cartesianas é + 2 =1. 

a? b? 

b) Mostre que as equações x = a cos (-2t) e y = b cos (-2t) 0<1<r 

definem a mesma elipse dada em (4). Encontre os “yetores-velocidade” 


2 7 
Consulte Leithold, L, op. cit., caps. 11 c 12. 
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13. 


14. 


> _ dx  dy+ 
nos casos (a) e (b). (V = aita j) 
c) Use o item (a) para traçar a partir de duas circunferências concêntricas 
2 2 
de raios a e b a elipse E a =1. 


Propriedade Reflexiva das Cônicas 

Um exemplo de aplicação da propriedade reflexiva das cônicas é dado pelos 
espelhos parabólicos, cujo formato é obtido pela rotação de uma parábola 
em torno do seu eixo de simetria. Tais espelhos transformam uma fonte 
luminosa colocada no foco em um feixe de raios paralelos (como num holo- 
fote) ou, reciprocamente, podem concentrar um feixe de raios paralelos em 
um único ponto (como no telescópio). Estas propriedades são explicadas 
por dois fatores: 


i) A lei física que governa o movimento das ondas (o ângulo de incidên- 
cia é igual ao ângulo de reflexão). 
ii) O teorema a seguir. 

Teorema: Sejam P um ponto de uma parábola e £ a reta tangente à 
parábola em P. Sejam f; a reta ligando o foco a Pe 8z a 
reta que passa por P e é paralela ao eixo, então os ângulos 
0 e a a seguir são iguais. 


a = âng. entre Le & 
8 = âng. entre Re VA 


Demonstre este teorema. 


Num espelho com a forma de um elipsóide de revolução, toda luz que 
emana de um dos focos se reflete sobre o outro foco. Este fenômeno é 
explicado por dois fatores: (i) Lei física da reflexão: ângulo de incidência 
igual ao ângulo de reflexão, (ii) Propriedade “reflexiva” da elipse que você 
mostrará a seguir. 
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Esta propriedade pode ter usos sérios (como por exemplo num laser) 
ou jocosos como uma sala de cochichos. (Se estivermos numa sala elipsoidal 


todo o som, que também é onda, emanado de um foco será perfeitamente 
audível no outro foco.) 


Teorema: Sejam P um ponto da elipse e £ a reta tangente a esta em P 
Sejam £, a reta ligando o foco F, a Pe &, a reta ligando o 
outro foco F, a P. Então os ângulos 8 entre as retas Re Lj e 
a entre g, e £ são iguais. 


Demonstre este teorema. 
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e a 
RESOLUÇÃO DE SISTEMAS 
DE EQUAÇÕES DIFERENCIAIS 


LINEARES 


12.1 INTRODUÇÃO 


Considere a seguinte situação: Um foguete está subindo verticalmente a partir 
do solo, sujeito à força gravitacional (que é de cima para baixo e supomos 
constante e igual a mg), a uma força constante para cima e a um impulso adi- 
cional para cima, proporcional ao tempo £ decorrido depois do lançamento. 
Que altura ele atinge + segundos após O lançamento? 

Denotando por x a altura, e usando o princípio de que força é igual a 
massa vezes aceleração (segunda lei de Newton), podemos escrever: 


dºx 


Rara E RS 


m 
Ao resolvermos esta equação teremos solucionado o nosso problema.! 
Este exemplo ilustra como somos levados a utilizar equações envolvendo 
derivadas. Assim como este, muitos outros fenômenos em Física, Química, Bio- 
logia, Economia etc., são descritos por equações diferenciais. 


1A resolução do problema é simples, bastando integrar duas vezes a equação e impor as 


condições iniciais x(0) = 0 e v(0) = E (0) = O sendo v(0) a velocidade inicial. 
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“Neste capítulo, presumiremos um conhecimento sobre derivadas de uma 
função de uma variável. Estaremos particularmente interessados na resolução de 
sistemas de equações diferenciais, onde são amplamente utilizados os conceitos 
de espaço vetorial, base, autovalores e autovetores. 


12.2 EQUAÇÕES DIFERENCIAIS 


Equações diferenciais são aquelas que relacionam uma função e suas derivadas. 
Por exemplo, as equações 


~ dx 
i) “dr -24=0 
„o dx 
ii) dE 3x 
o d?x dx 
HD qe tag 


são equações diferenciais. 

Para resolver uma equação algébrica (por exemplo, x? - 3x + 2 = 0) 
procuramos números (1 e 2 no caso). Para resolver uma equação diferencial va- 
mos procurar funções que satisfaçam a equação. Por exemplo: 

x = {° é uma solução da equação i). Uma outra solução de i) é x = £ + 
+ 5. O conjunto de todas as soluções de i) é expresso por x = £? + c, c constante, 


EA Š E E d(e”) t 
x = e? é uma solução de ii), pois Pu 3e*, Uma outra solução de 


ii) é x = 2e”. 

Podemos mostrar ainda que as soluções de ii) são exatamente as funções 
da forma x = ke”, sendo k uma constante. Temos, portanto, infinitas soluções 
para ii), assim como em à). 

Suponhamos agora que precisamos de uma solução de ii) tal que x(0) = 
= -S, Temos então x(t) = ke? e como x(0) = -5, devemos ter -5 = ke? *º 
o que implica k = -5. Isto é, a única solução para o problema 


, 


dx 
“dt = 3x 
x(0) = -5 (condição inicial) 


é x(t) = Se”, 
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De modo geral as equações do tipo de ii), ou seja, 


AX iy 
dt 


são chamadas de equações diferenciais lineares homogêneas de primeira ordem a 
coeficientes constantes e admitem como solução geral. 


x = ke”. 


Isto é, a expressão acima determina o conjunto de todas as soluções da equa- 
ção, variando-se o valor de k. 

Para comprovarmos que realmente é solução geral, devemos considerar as 
equivalências: 


dx Prata AÇO m -at -ät 
a Xea ax 0 = (a ax)e 0.e <= 
-at d(x . E j 
dt 


Agora, ao invés de uma única equação diferencial, podemos considerar 
sistemas de equações diferenciais. Estaremos então procurando um conjunto de 
funções que satisfaçam simultaneamente várias equações diferenciais. Chamamos 
tal conjunto de funções de solução do sistema de equações diferenciais. Vamos 
procurar também o que chamamos de solução geral do sistema, que é uma €x- 
pressão que gera toda solução do sistema. 
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12.2.1 Exemplos 


Exemplo 1: Encontre todas as funções reais diferenciáveis x, = x (1) e 
x, = x(t) que satisfaçam o sistema, isto é, encontre a solução geral do sistema: 


pi = -3x, + 4x, 


(8) 
E -Xi + 2x2 


Resolução: 


Se denotarmos 
dx, 
RIR SM 
X2 dt | dm 
dt 


Escrevendo o sistema ($) na forma matricial, temos 
dxı/dt | |-3 4||x 
dx, jdt “a 2 Xa 


dX -3 4 
do AX, onde À = É | 


ou ainda, 


Uma solução deste sistema é, então, uma matriz 


x(t) 
X=] ^! 
Eu 
cujos elementos são funções que solucionam o sistema de equações (8). 


.d 
Com base na solução geral da equação e ax, que é x = ke?! (veja 


o final da secção 12.2), vamos ver se existe, para O sistema, uma solução do 
tipo: 
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Isto implica que A? +A-2=0,ousea,A = 1 e M = -2. Para À, = 1 obte- 


1 a ; A 
mos o autovetor V; = $ e, portanto, uma solução para o sistema será 


dX 
Neste caso, calculando —— , temos 


l A 
dt nendele ý 


4 E 
Para À, = 2 obtemos o autovetor v} = | e teremos outra solução, X2 = 


= v,e”, isto é, 


Como À, # M, vemos que X, não é múltiplo de X, (ou vice-versa) e dizemos 
então que X, e X, são soluções independentes do sistema. 
Além disto, como veremos em 12.3.1, o conjunto das soluções 


x, (é) 
xX = 
É J 
do sistema (§) é um espaço vetorial V de dimensão 2 e, portanto, duas solu- 


ções independentes geram V. Isto é, qualquer outra solução X é combinação li- 
near de X, e X,. Portanto a solução geral do sistema é: 


1 4 
xa) Eto | eU 


Para que X seja solução, devemos ter X = AX, e dessa forma ficamos com 


a| At. a| At 
SME sa [gle 


ou seja, 


1 


a pd - 
Pensando em | J = v como um vetor de R?, a última equação se torna : , 
sendo cı € c, constantes. Na verdade, V é um espaço vetorial complexo (veja a 
secção 12.3.1) e assim c} e cz são números complexos. Dependendo do in- 


Av = Av | 
teresse, porém, pode-se considerar apenas as soluções reais, tomando c, € €z 


reais, 
que é exatamente a equação de autovalores e autovetores da matriz A. Ou ainda, como 


Concluímos, então, que X = vel! é solução do sistema se, e somente se 


À é autovalor e v é autovetor da matriz À. 
Procurando os autovalores e autovetores de A, resolvemos 


as funções soluções do sistema são 


x1(t) = e! + 4ce * 


x(t) = ce + ce” Biblioteca de ` 


Ciència & Tecno! 


Pe 


322 ÁLGEBRA LINEAR 


sendo c, e c, arbitrários. 


Se impusermos ao Exemplo 1, colocado acima, as condições iniciais 


x1(0) = -1 


temos: 


xA = ce + 4c,e 
xlt) = cje! + eze” 


para t= 0 
-1 = Cı + dc, 
2 = ĉi + C2 
que implica que cı = 3 e c3 = -1 


Portanto, substituindo, 


x, = 3e - 4e% 
x, = 3e! - e” 


Esta é a única solução de 


tal que x, (0) = -1 e x,(0) = 2 


dx 
a = -3X1 + 4x3 
dx 


No exemplo anterior obtivemos dois autovalores reais distintos. O sistema 
se resolve da mesma maneira, no caso de autovalores complexos distintos, como 


foi colocado no exemplo abaixo. 


Exemplo 2: 
dx 
e =x, -2x2 
dx = 2x, t XxX 


dt 


e x2(0) = 2, 


Temos 
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Malezi ev= (i 


e 


M=l-2i e v- [7] 


Portanto a solução geral è 


X= 


cy [i e te es 
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Ainda se faz necessário indicar outro exemplo importante, onde ocorrem auto- 
valores complexos. 


Exemplo 3: (oscilador harmônico simples) 


Figura 12.2.1 


Consideremos um corpo rígiao de massa m preso a uma mola cuja cons- 


tante de elasticidade é k (k > 0). Suponhamos que não haja atrito e que a 
massa da mola seja desprezível em relação a m. Sejam u o deslocamento do 


corpo e v sua velocidade, Inicialmente, quando t = 0, o corpo apresenta-se des- 
locado de uo e parado (vo = 0). 


Usando a segunda lei de Newton, montamos o sistema 
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cujas condições iniciais são: 


u(0) 
x(0) 


Na forma matricial 


Ho 
0 


h 


dv k 

dt 0- arn y 
du | 

dt 1 0 u 


Os autovalores e autovetores da matriz são: 


uer yW = 
m 

i k 
med fé e ka 


A solução geral do sistema é então 


H Da l Em [ao y e b Hm [ester 


u i 


| 
eu 
Ka 
z3 
LS 


l 
l 
5 
3 
C=] 


Impondo as condições iniciais, obtemos 
k . JK 
0 i pa c& -i /—c 
| = m ` m? 
u 
o c te 
: tio 
ou seja, Ci = C2 = ; 


Portanto, a solução procurada é 


pk, 
i Jeet ce) 


ça RR I- 
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Usando as relações de números complexos 


e + gil 
cos 0 = 
2 
iĝ -iĝ 
e” -e 
sen 8 = 
2i 
temos finalmente a solução: 
k k 
v = -uo /— sen /—t 
m m 
Je 
u = Uo cos — t 
m 


12.2.2 Resta-nos ainda analisar o caso de sistemas de 2 equações em 
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que a matriz A admite apenas um autovalor À. Temos então duas situações: 


i) A admite dois autovetores v; e v, LI. 


i) A admite apenas um autovetor v LI. 


At Ar 


No caso i) obtemos duas soluções LI, X, = vie 
A solução geral é então 


e X, = we 


X = cive + cave 


No caso ii) obtemos somente uma solução do tipo vem, Entretanto, podemos 


mostrar que existe uma outra solução Ll com a anterior, do tipo 


Cit + dı eN 
Cat + dı 


Substituindo-a no sistema, encontramos os valores para c;, C2, d; e dy, € 
então a solução geral é 


E At cit +di | Nt 
X= cve" tc Eos e 


Este método usado para obtermos uma segunda solução é conhecido como mé- 


todo da variação dos parâmetros”, 


2 Para maiores detalhes consulte, por exemplo, Pais Leme, P.J.S.; Notas de Equações 
Diferenciais Ordinárias, Impa, Rio, 1972; e Leighton, W.; Equações Diferenciais Ordi- 
nórias; Livros Técnicos e Científicos, Rio, 1970. 
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Você entenderá melhor este método ao resolver o Exercício 5 da secção 
12.4. 


12.2.3 Caso Geral: Só resolvemos até aqui sistemas de duas equações. Po- 


rém, tudo o que fizemos pode ser extrapolado para n equações, com as adapta- 


ções necessárias, Também neste caso a resolução é mais simples quando obte- 
mos z autovetores LI. 


Exemplo 


dx 


Fa I4x + 66y - 42z 


ay 
oe + 24y - 
A 4x + 24y - 14z 


dz 
Prg 10x + 55y - 33z 


A matriz é 


14 66 -42 
4 24 -14 
10 55 -33 


Calculando os autovalores e autovetores LI associados, temos: 


A =2 com v = (-11, 2,0} e v = (7,0, 2) 
A = 1 com v = (6, 2, 7). 


Portanto, a solução geral é 


x -]1 7 6 
Asa) 2 fe” +c, |0 le” +c, ]|2jļe' 
z 2 7 


Vamos analisar agora os casos em que num sistema de três equações não 
conseguimos três autovetores Ll para a matriz A. 


i) Seo polinômio característico é da forma (À - a}? (A - b), e associado ao 
autovalor a conseguirmos apenas um autovetor LI, procuramos uma ter- 
ceira solução independente da forma 


cittd, 
X(t) = | cat + dz | 
cat + d3 


Resolução de Sistemas de Equações Diferenciais Lineares 327 


ii) Se o polinômio característico é da forma (À - a)*, então podemos ter 
duas situações: 

a) ao autovalor a estão associados dois autovetores LI, v} e v,. Neste 
caso temos duas soluções LI: ve” e v,e” e existe, como em i), a 
terceira solução LI exatamente como a dada acima. 

b) ao autovalor a está associada apenas um autovetor v LI. Temos então 
uma única solução LI da forma X; = ve”, 

Neste caso mostramos que existem mais duas soluções LI da forma 


cit+d mt? tnt+k, 
X2 =| cat + dz je” e X; =] mP tmt +t k, e! 
Cat + d3 mat? + n3t + ks 


Aqui, como nos itens anteriores, as constantes, cj, dj, mj etc. são deter- 
minadas substituindo-se as soluções no sistema. 


12.3 RESOLUÇÃO DE SISTEMAS DE n EQUAÇÕES LINEARES 
HOMOGENEAS DE 14 ORDEM A COEFICIENTES CONS- 
TANTES 


Esta seção envolve um problema genérico, que consiste em procurar um con- 
junto de n funções reais que satisfaça, ao sistema: 


dx 
— = GuX, Tt... tax 
dt M+1 inn 
dx, 
de = aay X; t... t aämăn 
(8) 
dXn 
“de an, Xı +t... tann 


onde os ajj s são constantes reais. Na forma matricial temos: 


+ dn än ain Xı 
dt 
Xn a a a x 
nn 
dt ni n2 n 


328 ÁLGEBRA LINEAR 


x 
Uma solução será uma matriz X =| : |, cujos elementos são funções que 
Xn 


solucionam o sistema (8). 
O fato essencial que relaciona sistemas deste tipo com a Álgebra Linear 


é dado pelo teorema seguinte. 


12.3.1 Teorema: O conjunto S de todas as soluções do sistema 


X = AX é um espaço vetorial (complexo) de dimensão n. 
X1 Yı 

Prova: De fato, observamos que se X=| : |e Y=|: | são soluções do 
Xn Yn 


sistema, então X + Y e KX (k € C) são soluções, pois 


dX +Y) dX dY 
<a cart de A ANS AQUA) 


Isto é, X + Y é solução. (Um procedimento análogo é usado para mostrar que 
kX é solução do sistema. 


Vemos assim que S é um espaço vetorial complexo (subespaço do espaço 
vetorial das funções definidas em R com valores complexos). Para mostrarmos 
que a dimensão de S é n, isto é, que existem n e não mais que n soluções 
linearmente independentes, precisamos do Teorema da existência e unicidade de 
solução de um sistema dt equações diferenciais com condição inicial. 


12.3.2 A proposição anterior pode ser utilizada para se achar a solução 
geral de um sistema. Assim, se encontrarmos n soluções linearmente independen- 
tes do sistema 


dX 4 AXE ax: 
“dt = AX, Xi, «n Xn, (isto é -7 = AXi) 


3 e to . f ri ga 
A demonstração deste teorema não será feita aqui, mas se você estiver interessado 
em estudá-la veja, por exemplo, Paes Leme, op. cit. p. 56. 
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podemos gerar todas as soluções do sistema, e qualquer uma delas será da for- 
ma: 


X=0X +t..teaX (EC). 
Note que cada solução X, é uma matriz n X 1 de funções: 
xi (t) 
X; = 


xin(t) 


12.4 EXERCICIOS 


1. Uma colônia de bactérias cresce a uma razão diretamente proporcional ao 
número de bactérias presentes. (Se chamarmos de B(t) a quantidade de 


bactérias depois de um tempo t, isto significa que E B(t) = k- B(t), k = 


= constante.) Se o número de bactérias triplica em duas horas, quanto tem- 
po será necessário para que tenhamos cinquenta vezes a quantidade inicial? 


Nos Exercícios de 2 a 5, dê a solução dos sistemas lineares. 


dx dx 

2. m PE ap 3. a 
dy dy 
gTV a Y 


com condição inicial x(0) = 1, y(0) = 2 


4 [F = -9x + 19y + 4z 
Sa -3x + 7y +z 
e Tx + 17y + 22 
E =-x+3y Biblioteca de 


Ciênci cho 
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6. Num circuito LC, seja um indutor de indutância L ligado em série com um 
capacitor de capacitância C. Seja i a corrente que circula no circuito e q a 


carga no capacitor. i 
( L 
C 
> 


Suponhamos, inicialmente, que a corrente no circuito seja ip e o capacitor 
tenha uma carga Go. Sabendo que a diferença de potencial no indutor é 


L a e no capacitor é Fê temos o sistema de equações diferenciais 
di q 
— += 0 
É dt C 
a., 
dt 


Encontre as expressões da carga e da corrente em função do tempo. 


12.4.1 Respostas 


2 £n 50 
Rn 3 


2. x(t) = cre” + 3c,e” 
yA) = cie + Scge”! 


3. x(t) = es! 
(À = 2e7%t 


4. x(t) = ci(9 - 4! + co(9 + Ae! + 3c 
IA =aG-DE + c3 +! +c, 
z(t) = (7 - 2)! + c,(7 + 2e" + 2c3 


5. Solução: A matriz associada é A = Ê Al 
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Outra solução LI é do tipo 
= Cit + di 2t 
X= Es + A f 


XOAK 


-wd 
Então r 


Como 
$ dX _ cij a cit td at 
© -FF fele + Aoa 2e 
e (cı tc) + (d; + d2) 
e (i) AX, = o 
Edo fa - ent + (Bda - dy) f 
Igualando (j) e (ii), temos: 


Ztt2d +c =(c1 te)ttd td 
2c2t + 2d} + di = (3c3 - cX% + 3d - dı 


Como isto é uma identidade de polinômios, igualando os coeficientes, 


temos; 
<; tc; =0, do td =c, -c tc =0 e -ditd,=c 


Portanto, c} = 1,c&2 =1,d =0 e d =l e 


Š t 2t 
X, = , + ie 


A solução geral é 


x(t) = kye! + kate 
y(t) = kje?! + k(t + De? 


. i(t) = aket! + Bket! 


a(o) = ae" - pe™ 


_ io tkgo _ io - kg E l 
onde « SE B É E e Jar 


Leituras Sugeridas e Referências 


A=2 e ve! 


| o único LI. Uma solução é X, = 


Winston, Inc., New York, 1973. 
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PROCESSOS ITERATIVOS E 
ALGEBRA LINEAR 


13.1 INTRODUÇÃO 


Em qualquer problema concreto é necessário não apenas saber que uma solução 
existe, mas também chegar a esta solução em termos numéricos. Os problemas 
que aparecem na prática, no entanto, envolvem tantas variáveis ou são tão difí- 
ceis que tornam-se praticamente impossíveis de serem resolvidos sem o uso de 
recursos como calculadoras, computadores etc.. (Tente, por exemplo, resolver 
um sistema linear de 100 equações e 100 incógnitas.) Há necessidade, então, de 
desenvolver processos numéricos que possam ser usados em computação eletrô- 
nica. Estes processos podem ser divididos em dois grupos: processos exatos e 
processos iterativos. 

Por um processo exato entendemos um processo através do qual se obtém 
a solução numérica de um problema por meio de um número finito de opera- 
ções elementares. O método de resolução de sistemas lineares por redução da 
matriz, que vimos no Capítulo 2, é um exemplo de processo numérico exato 
que pode ser programado e usado em computadores (embora para este fim 
existam outros métodos exatos de resolução de sistemas lineares que são me- 
lhores, como o método de Gauss que utiliza uma quantidade menor de opera- 
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ções, reduzindo o tempo de uso do computador e possibilitando, conseguente- 
mente, uma maior economia). 

Um processo iterativo de resolução de um problema é um processo em 
que se obtém uma sequência de soluções aproximadas do problema, tal que 
cada termo da seqüência é obtido a partir dos anteriores por um processo bem 
determinado e que, num certo sentido, está “cada vez mais perto” da solução 
correta do problema. 

A escolha de um ou outro processo (quando houver esta possibilidade) 
vai depender de uma série de fatores: da precisão desejada dos resultados (e 
aqui devemos ressaltar que a expressão processo exato não quer dizer que se 
encontre a resposta correta, sem erro algum. Este erro quase sempre aparece 
na prática, pois as máquinas calculadoras têm apenas um número finito de dí- 
gitos e assim, em cada operação haverá um erro de arredondamento), da capa- 
cidade de memória do computador empregado, do tempo despendido em com- 
putação, do problema em particular. Por exemplo, o processo iterativo é me- 
lhor quando as matrizes envolvidas são esparsas, isto é, com muitos zeros, ou 
quando existe uma fórmula para calcular os elementos da matriz, evitando que 
seja necessário o armazenamento etc. Por razões técnicas, durante vários anos 
houve preferência generalizada pelos processos iterativos, mas com o desenvol- 
vimento de computadores em grande capacidade de memória e rapidez, os pro- 
cessos exatos voltaram a ser interessantes do ponto de vista prático e, atual- 
mente, são competitivos com os processos iterativos. Estes últimos, no entanto, 
continuam a ser muito importantes e serão os que estudaremos aqui através de 
sua conexão com Álgebra Linear. 

Suporemos que você saiba um pouco (não muito) sobre limites e seqüên- 
cias de números. 


13.2 SEQUÊNCIAS DE MATRIZES 


Começaremos considerando uma sequência infinita de matrizes de ordem r x s, 
A 5 As, E An, Ån +1” Es onde 


E a M aa 
“sj: : Mi i a 
E casa a dpa as) 
MP PP 
-n Ån = : : 
a a OR Si 
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O. Í RODIE 
com todos os aij números reais ou complexos. Representamos tal sequência 
por (An }nEN 


13.2.1 Definição: Dizemos que a sequência (An JngN de matrizes con- 
verge para (ou se aproxima de, ou ainda tem como limite) a matriz A = la;;] 
(de mesma ordem) se os elementos das matrizes A, se aproximam dos elemen- 
tos correspondentes da matriz A, isto é, 

lim amo = aj para | i Spat 
fue 


n> oq 
Neste caso, usaremos a notação 
lim Ap =A ou A> A 


n> oo 


Exemplo: Seja a sequência (A, nen onde 


l 5 
Rs E 
An = 
3 3n +11 
2n 
E 1 9 
tz 2 2 
NÃO, pa O ayal? T ai eim Ad A 
3 2], 3 1 n>% 3 2 
4 2 


Um caso particular importante da definição anterior é quando as matrizes 
são vetores-coluna, X,. Neste caso, 
x? 
X% =|: | 0 >X= 
Ro 
se lim XP =x; para i=1,2,..,7. 
n> 00 
13.2.2 Definição: Usando as notações da definição 13.2.1, dizemos que a 
série de matrizes (soma de infinitas matrizes) 
A +t A, t.. t An t Agr to. 


tem como soma uma matriz S e escrevemos S= A, + A; +... sea seqüência 
(B,hen, onde By = A, t+... + Ay tem como limite a matriz S, isto é, 


lim (A + A, t.. tAg)=S 


n> 0 
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Como o limite de uma sequência de matrizes é formado pelos limites dos 
elementos, certas propriedades de limites de sequências de números também são 
válidas para sequências de matrizes. Por exemplo, constantes multiplicativas 
podem ser colocadas fora do limite em sequências numéricas, isto é, 


lim ka, =k- lim a,, o mesmo valendo para matrizes. Isto é, se Q; € 
n> 00 n> co 


Q, são matrizes constantes, então 
lim (Q; e An) = Q; . lim Ay e lim (Am he Q.) = (lim An) a Q., 
n> oo n> 00 n>% n> 00 


desde que sejam possíveis as operações. 

Os resultados que vêm a seguir mostram outras situações em que, sob 
certos aspectos, as sequências de matrizes comportam-se como seqüências de 
números. A primeira delas é que, dado um número real ou complexo a, com 
lal < 1, as potências de ja] são números cada vez mais próximos de zero, isto 


é, lim lajf =0,e portanto lim a* = 0. Além disso, se la| > 1, lim aé não 
k > oa k> co k > oo 


é zero. 

Você deve conhecer ainda que se tivermos uma seqüência de números que é 
uma progressão geométrica de primeiro termo 1 e razão a, com |a] < 1, então 
a soma dos termos (infinitos) desta progressão existe e é dada por 


Itata? ta takt s 
-a 


Estes dois resultados também são válidos (com certas modificações) para 
seqüências de matrizes, como veremos nos teoremas 13.2.4, 13.2.5 e 13.3.7. 

No que se segue, estaremos considerando todos os autovalores de uma 
matriz quadrada A, inclusive os complexos, mesmo que A tenha apenas elemen- 
tos reais. 

13.2.3 Teorema: Seja A uma matriz quadrada r xr. Então lim A*-0 

> co 

(matriz nula r x r) se e somente se todos os autovalores de A têm módulo me- 
nor que 1. 


Prova: Suponhamos que A seja diagonalizável. Existe então uma matriz inversí- 
vel, Q, tal que 


u 0 0 
0 w 

QAQ = 
0. Ar 


onde os À; são os autovalores de A, isto é, 
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` 0 0 

o à . 
A=Q.- |. : "|. o 

0 Ar 


à 0 0 | a o0 0 
k 0 dh 0 NÉ 
A“ =Q: QU =Q.]. q! 
0 Ar 0 pi 
E portanto, 
NE ap O RR n 0 
i As = |i a x -h O0 ; E -1 
PD E Md E i 
DS on X Do a A$ 


Como [MI < 1, ħal <1,.., [Apl < 1, então lim MF = 0 para i= 1, 7 
k > oq 


e portanto, 
lim Af-Q-0.Q1=0 
k> oo 


Vamos mostrar agora que, se o A* = 0, então |A;| < | parai= 1,..,r. 
> 00 


Suponhamos, por absurdo, que um dos autovalores, por exemplo o à, tem 
módulo maior ou igual a 1. Então, lim aÉ * 0. Dessa forma 
> 00 


5 | AK e 0 ) 
lim A*=Qllim |} ¿floro 
Cre a K a. 


o que contradiz o fato inicial de que lim AF = 0. Portanto, todos os autova- 
> 00 


lores devem ter módulo menor que 1. 


O caso geral, isto é, quando A não é diagonalizável, é feito de modo aná- 
logo só que, no lugar da forma diagonal, é usada a forma de Jordan. Depois, 
tente fazer esta demonstração, como exercício. A dificuldade estará em se esta- 
belecer a expressão da n-ésima potência da forma de Jordan da matriz A. 

Vejamos mais uma situação em que as sequências de matrizes apresentam 
um comportamento semelhante às sequências de números. 
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13.2.4 Teorema: Seja A uma matriz quadrada r xr. Então, lim Až =0 
> 00 


se e somente se I - A é uma matriz inversível e I+ A +t A? +.+ A* a PR 
= (I - A), onde I é a matriz identidade r x 7. 


Prova: Suponhamos primeiro que I + A + A? +.. +t AK +..= (I - A), isto 
é, que lim (I +A +.. +AY=(1-A)). 
k > 00 


Portanto, lim (I+ A +... + At + AMIy=(- A). 
> 00 


Subtraindo as duas igualdades, temos 


O=(1-A)! -(1-A)! =lim (+ A+... + AŤ + AÉt) - lim d+A+.tAM= 
>00 >00 


=lim A*t! =lim A“. 


> 00 k >00 


Suponhamos, por outro lado, que lim AF = 0. Pelo teorema anterior vemos 
+00 


que os autovalores de A têm módulo menor que l e, portanto, o número 1 
não é autovalor, o que implica det (A - 1 » I) + O. Então, a matriz A - 1-1 
é inversível. Assim, I - A também é inversível e (I - A)! existe. Vale ainda 
a identidade 
(+A +A? +. + AK (L-A) =I- Att. 
Multiplicando pela direita por (I - A)”, temos 
AA FALA +A (I-A) AAA)! 
Então E+ A+A? +... + AB +. 
=lim 1+4+..449=lim [( -A AG - Ay] 
k +00 koo 


=(1-A)! pois lim Aft! = 0. 
k >00 
Reunindo os resultados dos dois teoremas anteriores obtemos: 


13.2.5 Corolário: Se A é uma matriz quadrada, então os autovalores de 
A têm todos módulo menor que 1 se, e somente se a matriz I - A é inversível 


e vale 
L+ALA +t.. +A+. =(1-A)! 


13.3 RESOLUÇÃO DE SISTEMAS LINEARES — PROCESSO 
ITERATIVO 


Vejamos, agora, como esses fatos podem ser usados para resolver sistemas 
lineares. Consideremos o sistema: 
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103x - 0,02» = 7 
0,01x + 0,90p = -5,2 


Observamos que ele pode ser colocado na forma 


x 
Pá 


-0,03x + 0,02y + 7 
-0,01x + 0,10y - 5,2 


ou na forma matricial 
Xh -0,03 0,02 x| 4 7 
y|  ]-0,01 0,10 y -5,2 


-0,01 0,10 
lução do sistema é exatamente um vetor-coluna X que satisfaça X = MX + N. 
Queremos saber se existe algum processo iterativo para determinar tal X. 
Iniciemos o processo com um vetor qualquer X,. Por exemplo, tomemos X, = 


Chamando X = HE M = É apo e e N= pa , vemos que uma so- 


= H . Se calcularmos 


-0,03 0,02 1 7 |_| 6,97 
nc E s lol s a E EM 
e se usarmos o vetor obtido para obter X3, teremos 
-0,03 0,02 6,97 7 _ | 6,6867 
di dio E ção E ü [Lia 5 Ea 
Analogamente, se usarmos X, para obter X4, teremos 
-0,03 0,02 6,6867 7 6,683585 
E PS; 4 + F + = 
E A a ai ESA ES E 
Se em cada passo procedermos analogamente, isto é, uma vez obtido Xy, obte- 
mos X, +, pela fórmula X, +, = MX, + N, teremos montada uma sequência 
{Xn}nen de vetores-coluna. Será que estes vetores X, estão se aproximando 
de um vetor X que seja solução do sistema? Verifiquemos isto. Naturalmente, 
o sistema pode ser resolvido de forma usual (por exemplo, por substituição) e 


a solução é 
_ 650788 -6056 


* = -gys4l O 2 947 
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Efetuando as divisões, teremos x = 6,6824849 e y = - 5,8520276. Compare 
esses resultados com os obtidos em X4. 

Surge uma pergunta natural: em que condições teremos a repetição do 
que parece acontecer neste exemplo? Em outras palavras, quando a sequência 
X, se aproxima de um vetor X, que é solução do sistema? O próximo teore- 
ma nos dará uma resposta a esta pergunta, fornecendo um método iterativo de 
resolução de sistemas lineares que satisfaça determinadas condições. Antes de 
enunciá-lo e demonstrá-lo, precisamos estudar a relação entre as formas AX = 
= B e X = MX + N de um sistema. 

Normalmente, um sistema vem dado na forma AX = B. Entretanto, se 
quisermos aplicar um procedimento semelhante ao usado no exemplo anterior, 
esta forma não é satisfatória. É preciso colocá-lo na forma X = MX + N. Isto 
pode ser feito de várias maneiras. Uma delas é a que foi usada no exemplo: 


AX=[I+(A-DX=X+(A-DX-=B, 


ou seja, X = (I - A)X + B, e então tomamos M = I - A e N = B. O modo 
como são escolhidos M e N em função de A e B é importante na prática, e 
em 13.3.9 voltaremos a comentar este assunto. No momento, estamos apenas 
interessados na situação em que M e N já foram obtidos e então, começando 
com um vetor-coluna qualquer X,, montamos uma sequência (X, }n ey itera- 
tivamente pela fórmula X,,, = M - X, + N. Queremos saber, então, em que 
condições a sequência obtida se aproxima de uma solução do sistema. Como 
já dissemos, a resposta é dada pelo teorema a seguir. 


13.3.1 Teorema: Se um sistema linear é dado na forma X = MX + N, 
onde M é uma matriz quadrada tal que todos os seus autovalores tenham mó- 
dulo menor que 1, então, iniciando por um vetor-coluna qualquer X,, a se- 
qüência de vetores-coluna obtida pela fórmula 

Xn+1 = MX, + N 
tem como limite um vetor-coluna X que é solução do sistema X = MX + N. 
Dizemos, neste caso, que a segiiência converge para uma solução do sistema. 


Prova: Temos 
X = MX, +N 
X; = MX, + N=M(MX, +N)+N=MX, + (I+ MN 
X, = MX, + N = MM? X, + (1+ MN] +N=M°X, +(1+M + MIN 
e, procedendo por indução, obtemos 
X, =MUX, + (E+M+M +. +M”). 


Como M tem todos os autovalores com módulo menor que 1, pelo corolário 
13.2.5 e pelo teorema 13.2.4, temos 
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lim (I+ M +... + MID -= (I - My! 


n>00 


lim M” Ao 0. 


n >o 


Portanto, lim X, =lim [M"-'X, + (I+ M+... + MIN] = 


n>00 n>00 
=(1[- MN. 
Concluímos, então, que lim X, existe e chamemos 
n +00 


X=(I -M'N = lim X,. 
n>oo 


Tomemos agora o limite quando n > oo dos dois membros da igualdade X,+1 = 

= MX, +t N. Temos lim X,+, =lim (MX, + N) =M - lim X, +N, ou 
n>a n>00 n>00 

seja, X = MX + N e, portanto, X = lim, Xn é solução do sistema. 

O teorema que acabamos de ver é típico dos teoremas que aparecem em 
processos iterativos. Ele fornece um processo de construção mecânica de uma 
sequência que, sob certas condições, aproxima-se da solução do problema. Não 
é vantajoso aplicar manualmente estes processos, mas estes parecem bastante 
razoáveis quando se dispõe de uma calculadora automática programável. 

Entretanto, este teorema apresenta uma limitação muito séria na prática. 
Como verificar concretamente se uma dada matriz (peralmente de ordem alta) 
tem autovalores com módulo menor que 1? Calcular os autovalores seria uma 
resposta óbvia, mas não temos meios práticos e rápidos de fazer isto com ma- 
trizes de ordem alta (a não ser, talvez, por outros processos numéricos iterati- 
vos). Vamos ver, então, se conseguimos dar uma resposta bem simples e rápi- 
da, apenas examinando os elementos da matriz. Para isto definimos: 


13.3.2 Definição: Seja A = [a;;l, xs uma matriz. Chamamos de norma da 
matriz A e denotamos por I|JAil, o número não negativo 
S 
HAI = máx 3 lay] 


ISISr 4 
j=1 


Exemplo: Se 


então All = máx (121 + l-14, 181 + 10l} = máx (3, 8} = 8. 


O caso particular da definição anterior em que a matriz é um vetor-coluna 
nx l] é muito importante e por isso vamos repetir a definição neste caso parti- 
cular, dando um nome especial. 
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13.3.3 Definição: Seja 


um vetor-coluna. Chamamos de norma do máximo do vetor-coluna X ao núme- 
ro 
IXI = máx (lx), Ix51, -o Ixyl) 


Observação: No Capítulo 8, ao lidarmos com espaços vetoriais munidos 
de um produto interno (, ), demos o nome de norma de um vetor v ao núme- 
ro ilvli = (y, v). A noção que estamos apresentando aqui não provém de um 
produto interno, mas continua recebendo o nome de norma porque possui vá- 
rias propriedades em comum com o conceito introduzido no Capítulo 8. 


Vejamos algumas propriedades. 


ta add - (n) 
13.3.4 Teorema: Consideremos uma sequência de matrizes Ay = laj l» x s 
e uma matriz À = laijlr xs» tais que lim IIA, - AIl = 0. Então lim (A, -A)=0, 
n>0o0 n> oo 


ou seja, lim A, = A. 
n> Do 


n>00 [Gi Sr 


S AM) 
Prova: Temos lim IlA, - All=lim máx ( r2 laj -aj)=0 
à a 


n> 00 
Então para todo i = 1, ...,r, temos 
s 
; (n) 
lim X la; -agl=0 
n>00 
j=1 
Mas. se a soma de termos positivos tende a zero, cada uma das parcelas também 
É ” , + n z 
tende a zero. Logo, para todo į = 1, ..,rej=1,..,s temos lim laş - a;jl =0, 


ou seja, lim (a? - ay) = 0. Assim, lim (An - A) = 0. 
n>00 n> 


13.3.5 Teorema: Sejam A e B duas matrizes de mesma ordem e À um 
número. 
i) MAI = O se, e somente se A=0 
ii) JA + BI < Ali + BI! 
iii) IAAI = IA ÍA 
Prova: Faça como exercício. AO provar (ii) lembre que se a e b são números, 


então la + bl < lal + Ibl. Bibliotec 
Ciência & 7 
Ir 
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Observe que as propriedades do teorema anterior são três das proprieda- 
des da norma definida no Capítulo 8. A norma definida aqui, embora não pro- 
venha de um produto interno, tem também essas propriedades. 

Vamos precisar, ainda, de mais uma propriedade desta norma para de- 
monstrar os resultados seguintes. 


13.3.6 Teorema: Se A = [a7x],xs e B = [bg;]s xr são duas matrizes, 
então IIA - BII < IA]! . IBI, 


S 
Prova: Temos A - B = [ci], x, onde cij = by abr; 
k=1 


t t s 
Então IIA. Bll= máx legl= máx ( | dixbk; |) S 
ij 7 
=) k=1 


i< 4 IXi<r 
J= 
: lag) lbg D] = 
< máx ( am) lbgl) 
ISiISr > È ki 
j=1 
s | t | 
= máx la; by!) < 
Xi <r ( 3 k 2 y) < 
ka j=l 
- | bz: D] 
máx la; máx b 
S ISiSr PE ik t ISk Ss 2 kj ) 
= (máx lajgl) + (máx by!) 
ISiSr 3 ik 1 s 2, k 
=IlAll +. IIBII 


Uma situação particular desta proposição é quando B é um vetor-coluna X. 


Temos então IIA . XII < IAI . iIXII. Vamos ver agora qual é a ligação que 
existe entre a norma de uma matriz e seus autovalores. 


13.3.7 Teorema: Se A é uma matriz quadrada tal que IIAHI < 1, então 
todos os seus autovalores têm módulo menor que 1. 


Prova: Pelo teorema 13.3.6, temos IIA? Ill = IA <- Al < IAIL. IAI < HAIR 
e, indutivamente, IIAFII < IIAIÉ. Como IIAII < 1, temos 
O <lim IlAFI< < lim ILAJÉ = 


k>oo 
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ou seja, lim. AFI! = O e, portanto, pelo teorema 13.3.4 lim AF = 0. 


k >o 
Usando, a o teorema 13.2.3, vemos que os autovalores de A têm módulo 
menor que 1. 
Incluindo este último resultado no teorema 13.3.1, obtemos o seguinte 
teorema que fornece um critério para determinar se um sistema tem solução 
obtida através do processo iterativo. 


13.3.8 Teorema: Se M = [b;l,x, é uma matriz tal que ÍÍMII = 

r 

= máx y. tb! < 1 e N é um vetor-coluna r x 1, então, qualquer que 
ISIS, 4 

j=l 
seja o vetor-coluna inicial X,, a sequência de vetores-coluna, dada pela fórmula 
iterativa Xn +1 = M » Xn, tN, aproxima-se de um vetor-coluna X que é solução 
do sistema linear X=M -X +N. 

Como este último resultado pode ser usado na prática? Como já comen- 
tamos, um sistema que normalmente aparece na forma A « X = B sempre pode 
ser colocado (de vários modos) na forma X = M : X + N. A resolução do teo- 
rema anterior pelo processo iterativo, é viável, desde que esteja satisfeita deter- 
minada condição sobre M. Dependendo da maneira como colocamos o sistema 
na forma X = M . X + N, esta condição (suficiente) sobre M vai se refletir de 
maneira diferente sobre A. 

Por exemplo, na escolha sugerida, isto é, M = I - A e N = B, se A = 
= [a;;l, xr, a condição IIMII< 1 é a de que IlI - Al = máx (1 -al + 
+ lani +... + lapl} < 1. Isto significa em termos intuitivos que para esta es- 
colha de M e N o processo iterativo converge se a matriz de coeficientes A do 
sistema for razoavelmente próxima da identidade. 

Para conseguirmos convergência em outras situações, precisamos fazer 
outras escolhas para M e N. Nos meios computacionais, estas outras escolhas 
para M e N são feitas seguindo o princípio enunciado abaixo. 


13.3.9 Princípio: Dado o sistema A - X = B, escrevemos À = P - Q, 
onde P é uma matriz inversível. Então 


A-X=(P-QX=P-X-Q-X=B 
ou P.X=Q-X+B 


ou ainda X = (P!Q)X + PB. 
Então M = PQ e N=P/B. 


Este princípio pode ser ilustrado, desenvolvendo um processo que denominamos 
Método de Jacobi. 
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13.4 METODO DE JACOBI 


SRI s. air 


Se A= 1: : | coma; #0,i= 1, 7, 
âri asé arr 


podemos escrever 


air 0 O am Gir 
232 KESI dar 

A = + E 
0 rr rı lp 0 


au 0 am 0 


; š p 
0 Apr 0 rr 


Podemos tomar então em 13.3.9 


0 -412 -áir 
du 0 -G21 0 -lap 
P — ê Q = 
0 arr -âp -ån . 0 


Com esta escolha o processo iterativo obtido é chamado método de Jacobi. 
Neste caso 


0 -412 -air 
qn dii 
-d2 0 -ar 
: dis Ta 
M ba 22 
-4 “ap 0 
rr Grr 


A condição |IMİl < 1 para a convergência do processo iterativo é então que 
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-812 4 + ir <1] 
KSEI KETI 

-421 + + | Bar <1 
an2 422 

-ari | 4 + -ây r-1 <1 
ärr arr 


ou seja, |an | + | às: | ++ ESA < lan] 


jan | + [ar +*+ lose) < farr] 


Em outras palavras, no Método de Jacobi, a condição de convergência do pro- 
cesso é a de que cada elemento da diagonal seja, em módulo, maior que a so- 
ma dos módulos dos elementos que estejam na mesma linha. 


13.5 PROCESSO DE GAUSS-SEIDEL 


Um outro processo muito usado na prática é o chamado processo de Gauss- 
-Seidel. Considerando uma matriz A = lail xr com diagonal sem zeros 
(a; + 0, i =1,..., r), escrevemos 


am 0 Oan . a, 
aza Im 00 a. a 
A = + 
dn dm Grr 0 0 0 
em seguida tomamos 
áil 0 0 VEG] tus air 
n an 0 Gar 
P = A e Q no 
Gr m arr 0 0 


Note que P é inversível, pois os elementos da diagonal são não nulos e ela é 
triangular inferior. Neste processo é um pouco mais difícil escrever M e N, mas 
você deve tentar. Como você poderá verificar também, a condição IMH < l é 
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muito mais complicada de se expressar em termos da matriz A. Costuma-se, 
assim, trabalhar com uma outra condição suficiente (critério de Sassenfield). 


n 
Mas você pode verificar que a condição layl > 3 lai;l para i=1,2,..,n 
Fl 
Ei 
estabelecida no método de Jacobi também é uma condição suficiente para a 
convergência no processo de Gauss-Seidel. Você encontrará a prova destes cri- 
térios, bem como um grande número de exemplos, na bibliografia citada no 
final do Capítulo. 
O método de Gauss-Seidel costuma ser muito vantajoso nos casos onde a 
matriz é de ordem elevada e há poucos elementos diferentes de zero. 


13.6 ESTIMATIVA DE ERRO 


Dado um processo iterativo Xy+1 = MX, + N com MI < 1, sabemos que o 
processo converge, isto é, a sequência (X, }nen aproxima-se de um vetor-colu- 
na X que é solução da equação X = MX + N. 

Resta, entretanto, um problema prático: uma vez que não conhecemos a 
priori a solução X (na verdade é isto que queremos achar) como saberemos 
quando os X, estão suficientemente próximos de X? Intuitivamente a resposta 
é: calculamos os termos X,, Xp +1, etc. e em cada passo comparamos O valor 
obtido com o anterior, isto é, Xy+1 com Xy. Quando X,+1 estiver próximo 
de X, é porque provavelmente os termos não se alteram muito a cada passo e 
podemos dizer que Xy+, está próximo de X. 

Esta resposta intuitiva apresenta problemas sérios. Primeiro, o que signifi- 
ca exatamente a palavra próximo? Como podemos medir isso de forma que 
uma calculadora automática possa nos responder quando estamos “próximos”? 
Segundo, como podemos justificar a nossa intuição? Terceiro, na prática pre- 
cisamos saber exatamente qual é o erro cometido ao pararmos O processo ite- 
rativo num determinado passo, e não apenas saber que estamos próximos. 

Quanto ao primeiro problema, podemos solucioná-lo utilizando a noção 
de norma. Por exemplo, se 


x xt 1) 
Xn = : e Xr+ : 
x) trt 1) 


então 1X, +1 - Xy l! = máx ME dada E a [71 x1} e, portanto, 
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se a norma da diferença de X,+1 - Xn for pequena, os elementos correspon- 
dentes dos vetores-coluna estão próximos. 

Os dois outros problemas serão resolvidos de uma forma conjunta. Quere- 
mos saber qual o erro cometido ao pararmos o processo iterativo num certo 
passo. Vamos calcular, então, IX, + 1 - XII, onde X é a solução do problema 
X = MX + N. Para isto, sabemos que X,+, =M : X, +NeX=M-X+N. 
Subtraindo termo a termo obtemos 

Xr+: -X=M.; XŞ, -M.X 
Subtraindo M - X,+1, dos dois membros da última igualdade obtemos 
Xara -X-M- X1 =M- Xn-M-X-M. X 
ou Xni -X-M- X1 +M: X=M- Xn -M- Xy+ı 
ou ainda (I - M) (Xp+1 - X) = M(X, - Xn+1) 
Com a hipótese IÍMI! < 1 (para o processo convergir), aplicando o mesmo ra- 
ciocínio que em 13.2.5, vemos que E - M é inversível e que 
a) (I -M)! =1+M+M +.. 
Então Xp+1 -X =(1- M)’ ©- M(X, - Xn+1) 
Tomando as normas dos dois membros e lembrando 13.3.6, chegamos a 

b) IX sa - XIIS I(E- MDS IMI- Xy - Xy+: ll 
Usando 13.3.5 (ii) e 13.3.6 em (a), obtemos 


l 


I- My Il = E+ M +M? +.li<i + IMI + IMIP +... = ini 


Colocando esta expressão em (b), temos o teorema seguinte, 


13.6.1 Teorema: Consideremos o processo iterativo X, + 1 = MX, +N 
com IIMII < 1. Então a sequência (X,,en converge para a solução X do 
problema X = MX + N, de tal modo que 


Mil 
1X, yi = Xil Sed qd |X,+1 = Xyll 
1 -IMi 
Assim, o teorema justifica o nosso procedimento intuitivo e nos dá um 
meio de calcular o erro cometido ao pararmos o processo em um determinado 
passo. Por exemplo, se quisermos achar X com uma precisão de É, deveremos, 


a partir de um Xo qualquer, seguir o processo iterativo até que 


Mil 
UXp+1 -Xi< il 1X, + 1 - Xall < E, 
isto é, até que a norma da diferença de um termo com o seguinte, 
1Xy+1 - Xy|l, seja menor que EU 


348 ÁLGEBRA LINEAR 


13.7 EXERCICIOS 


2 01 1 
l. Seja A= |3 4 0 
0 1 


a) Calcule IIA!I. 
b) Ao resolvermos o sistema 


x 3 
Aclyl=|0 
Z IEJ, 
podemos garantir que o processo iterativo dado por X, = MX + N onde 


3 


M=I-AeN= | converge para uma solução do sistema? 
| 


. Se M é uma matriz quadrada tal que IIMII < 1, sabemos que seus autovalo- 
res têm módulo menor que 1. A recíproca é verdadeira? Isto é, se os auto- 
valores têm módulo menor que 1, então necessariamente IIMII < 1? 


. O sistema linear 


tt 
N 


-5x t2y+ z 
xt 7yt z=2 
x + y- 5Sz=2 


pode ser resolvido pelo Método de Jacobi? Se puder, calcule X; a partir de 


. Resolva o sistema linear 


6x +2y- 3z= 5 
-x + 8y + 32 =-10 
x + 4y + 12z 12 


pelo (a) Método de Jacobi (b) Método de Gauss-Seidel, a partir de 


1 
X = | , isto é, ache X4 e faça uma estimativa do erro [IX - XII, onde 


X é a solução correta do problema. O que você pode dizer sobre as veloci- 
dades de convergência dos dois métodos? 


S. Prove o teorema 13.3.5. 
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13.7.1 Respostas 


1. a) IAil= 9 


b) Não podemos garantir pois IIMIL > 1. 


2 6v3 
32 32 


ã i = i Il = 1,011875 e 
2. Não vale pois M = ENTE é uma matriz com IIM 01 


32 v 32 


no entanto seus autovalores são 0,875 e 0,125 aproximadamente. 


3. Pode, pois o módulo de cada elemento da diagonal é maior que a soma dos 


módulos dos outros elementos que estão na mesma linha. 


4. a) 191 


96 


X4 = a e IX, -XII < 1,85 


2f 
16 


b) 2317 
1152 


-13829 “xXIL< 
A| e IX4 - XI < 0,151 


12281 
9216 


O processo de Gauss-Seidel converge mais rapidamente que o de Jacobi. 


X, = 
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CONJUNTOS CONVEXOS E 
PROGRAMAÇÃO LINEAR 


14.1 INTRODUÇÃO 


Um problema de otimização envolve maximizar ou minimizar uma função restrita 
a certas condições. Estamos sempre interessados em minimizar custos, maximizar 
lucro, rendimento etc. A programação linear é uma técnica que permite a resolução 
destes problemas no caso específico em que as funções a serem analisadas são 
funções afins (lineares mais constante) e as restrições são dadas por desigualdades 
lineares (regiões poliedrais convexas). 

Neste capítulo, introduziremos os conjuntos convexos e analisaremos os 
máximos e mínimos que as funções afins assumem nestes conjuntos, traduziremos 
problemas concretos para esta linguagem e procuraremos resolvê-los. Isto será feito 
de uma maneira mais conceitual e geométrica nas seções 14.2 e 14.3, e de uma 
maneira algorítmica e programável na seção 14.5, escrita pelo professor Antonio 
Carlos Moretti, que vem trabalhando em muitos problemas nesta área e que nos deu 
valiosas sugestões para esta nova versão. 

Os resultados de conjuntos convexos e programação linear começaram a ser 
organizados no final do século passado e início deste século, a partir de trabalhos de 
matemáticos como H. Minkowski, A. Haar, H. Weyl. A partir dos anos 40 tivemos 
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um rápido desenvolvimento dessa área, principalmente no que se refere ao 
desenvolvimento de algoritmos que permitiram programar e resolver inúmeros 
problemas aplicados envolvendo muitas variáveis. 

A grande difusão da programação linear nos últimos anos deve-se ao fato de 
que, embora ela trate de um problema específico, ela é uma técnica simples e 
muitos problemas do cotidiano podem ser formulados segundo esta linguagem. 


14.2 CONJUNTOS CONVEXOS 


As noções que introduziremos a seguir visam uma caracterização de regiões 
convexas especiais. O conceito de variedade linear de um espaço vetorial é algo que 
abrange seus subespaços e as translações destes. 


14.2.1 Definição: Um subconjunto A de um espaço vetorial V é uma 
variedade linear de V se existe um subespaço W de V e um vetor vo de V, tal que: 


A =;vEeV;v=votwparawe w? 


Usaremos a notação 4 = vo + W para indicar a variedade linear. Observe 
que se vo + O, então A não é um subespaço. Por dimensão de A, denotada 
dim A, entendemos a dimensão de W. 


14.2.2 Exemplos 


Exemplo 1: Um exemplo de uma variedade linear de dimensão 1 no R? 
é uma reta (que passe ou não pela origem), como indica a Figura 14.2.1. 


Figura 14.2.1 Biblioteca de | 
Ciéncia & Tecnol 


€ 
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Um ponto do plano é uma variedade linear de dimensão zero. 


Exemplo 2: Todo subespaço é, em particular, uma variedade linear 
(vo = 0). 


Exemplo 3: Como já vimos (Exemplo 9 de 4.3.2) o conjunto-solução de 


l 
1 
0 


2x + 4y +t z 
xt y+t2z 
x+t3y- z 


i 


não é um subespaço vetorial de M(3, 1). Resolvendo o sistema vemos que os 
vetores-solução são da forma: 


2 pii 
x 2 2 
() lyl=[-1|+A) 3], para VAER 
z 2 2 
0 l 
Note, ainda, que os vetores do tipo 
-7 
pr 
A |3 
2 
l 


sendo solução do sistema homogêneo associado (Exercícios 20 e 22 da secção 
2.6), formam um subespaço, W, de MG, 1), de dimensão 1. Portanto, o con: 
junto dos vetores-solução do nosso sistema, descrito em (*), é uma variedade 
linear de dimensão 1. 


a 
ti 
o s| nje 
+ 
= 


Exemplo 4: De modo geral: se um sistema de equações lineares é compa- 
tível (isto é, admite solução) seu conjunto-solução é uma variedade linear de 
dimensão igual ao grau de liberdade do sistema. (Verifique isto! Compare com 
o Exercício 21 da secção 2.6.) 


No caso particular do Exemplo 4 acima em que temos apenas uma equação 
linear, a variedade linear determinada por esta equação será chamada hiperpiano. 
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Por exemplo, em R? (observe que estamos identificando M(3, 1) com Rº), o hi- 
perplano determinado pela equação 2x + 3y + 3z - 2 = 0 é o plano 


2 


Figura 14.2.2 
No caso de R?, um hiperplano é uma reta (faça um exemplo). 


Um hiperplano divide o espaço vetorial em 2 semi-espaços. Por exemplo, 
ao considerarmos o hiperplano em R? descrito por 
2x +3y+372-2=0 


teremos o espaço dividido em aois semi-espaços que são os pontos (x, y, z} que 
satisfazem 2x + 3y + 3z - 2 > 0 ou 2x +t 3y + 3z - 2 < Q, respectivamente. 
Na figura 


Figura 14.2.3 


a região hachureada representa o semi-espaço 2x + 3y + 3z - 2 <0. 

Se considerarmos, agora, o hiperplano x + y - | = O no R? (que é uma 
reta no plano), qual é o semi-espaço descrito por x + y - 1 > 0? (Note que 
como aqui o espaço vetorial é o R?, o semi-espaço será dado geometricamente 
por um semi-plano). Para resolvermos este problema, uma vez traçado o hiper- 
plano (no caso a reta) x + y - 1 = O, escolhemos um ponto de R?, por exem- 
plo a origem (0, 0) e verificamos se ele satisfaz ou não a desigualdade. Neste 
caso, como para x = 0,73 =-0,x+y-1=-|<N,o ponto (0, O) não está 
no semi-espaço procurado; este será aquele que não contém a origem. 
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A 
(0, 0) (1,0) Lo, 


x+y-1=0 


x 


Figura 14.2.4 


Usa-se, ainda, distinguir entre semi-espaço fechado (o que contém o hi- 
perplano) e semi-espaço aberto (o que não contém o hiperplano). No último 
exemplo, o semi-espaço aberto, descrito por x + y - 1 > O, será o semi-plano 
assinalado, excluindo-se a reta x +y - l =Q. 

Para hiperplanos definidos por uma equação de mais do que três variáveis 
não teremos uma visão geométrica dos semi-espaços vetoriais como nos exem- 
plos anteriores, mas estes conceitos são abordados da mesma maneira: 


Hiperplano H= (x;, Xp) ER”; 41X} +...tax=b 


é uma variedade afim de dimensão n — 1 que divide o R” em dois subespaços 
fechados. 


Hº=(x,..., Xp) ER”; 41X1 +...ta,x, e 


>b 
H= (x1, Xp) ER”; 01X] +. tanXp <b 


14.2.3 Vamos agora apresentar um problema que nos guiará nos itens a 
seguir. Suponhamos que um agricultor queira adubar a sua plantação e dispo- 
nha de dois tipos de adubo. O primeiro contém 3g de fósforo, 1 g de nitrogê- 
nio e 8 g de potássio, e cústa 10 u.c.p. por quilograma. O segundo tipo contém 
2 g de fósforo, 3 g de nitrogênio e 2 g de potássio, e custa 8 u.c.p. por 
quilogrania. Sabemos que um quilograma de adubo dá para 10 m? de terra, e 
que o solo em que estão suas plantações necessita de pelo menos 3 g de fósfo- 
ro, 1,5 g de nitrogênio e 4g de potássio a cada 10 m?. Quanto o agricultor de- 
ve comprar de cada adubo, para cada 10m? de terra, de modo a conseguir ter 
O minimo custo? 
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Necessidades 
minimas de adubo 


Fósforo 
Nitrogênio 


Potássio 


Custo 10 u.c.p. | Custo 8 u.c.p. 


Chamemos de x a quantidade em kg de adubo do primeiro tipo e y a do 
segundo tipo. Evidentemente, x e y não podem assumir qualquer valor, pois de- 
vemos ter x > 0e y > 0 e, além disso, xkg do primeiro adubo fornece 3x g 
de fósforo, enquanto que y kg do segundo tipo fornece 2yg de fósforo. Então, 
se usarmos x kg do primeiro e y kg do segundo, estaremos adicionando 3x + 2y 
gramas e, pela exigência mínima do solo, devemos ter 3x + 2 > 3. 

Analogamente, para o nitrogênio e o potássio deveremos ter x + 3yz21,5e 
8x + 2y > 4. Então os valores x e y devem satisfazer simultaneamente: 
(9) x>0, )>0, 3x+ y> 3, xt3r215, 8x +y 24. 


Colocando num gráfico as quantidades x (como abscissa) e y (como ordenada), 
como mostra a Figura 14.2.5 observamos que estas restrições nos conduzem a: 


njw 
eb 
x 
X 


+ 


1 
7 A P5 77 
A Nas 
3 
4 ' 2 x+3y-1,5=0 
3x +2y -3-0 
8x +2y-4=0 Figura 14.2.5 


Biblioteca de Ta 
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Isto é, para que os valores x e y satisfaçam simultaneamente todas as desigual- 
dades. o ponto (x, y) deve estar na região hachureada 4. Note que esta região 4 
é dada por uma intersecção de semi-espaços fechados do R?. 

Além disso, queremos que o custo dado pela função 


f(x, y)= 10x +8y 
seja minimo, isto é, estamos procurando na região hachureada qual é o ponto 
(x, y) no qual f(x, y) tem o menor valor. 
Para resolver este problema devemos, então, estudar um pouco mais as 
propriedades dos conjuntos do tipo de A e das funções do tipo f(x, y). Para 
isto precisamos das definições dadas a seguir. 


14.2.4 Definição: Sejam A e B dois pontos do R”. O segmento de extre- 
mos A e B é o conjunto AB de pontos R”, dado por: 
ÀB = {(1 - NA + tB; O<t<I) 


Esta definição corresponde exatamente à nossa intuição de segmento em 
dimensão dois e três. 


Observe que no segmento AB o ponto que corresponde a t = 0 é o pon- 
to A, o ponto que corresponde a t = | é B e, a qualquer ponto P do segmen- 
to, existe t+, E R tal qe O< 1 SleP=(1 -7,)A +t,B. Tomemos, por 
exemplo, A = (1, 2) e B = (3, -1) em R°, Dado o ponto P = (5 0) sobre o 
segmento, podemos escrever (5 50) =(1 - Ea, 2) + $ (3, -1), ou seja, 
existe t = E (0 < ¢ < 1), tal que P = (1 - t)A + tB. Por outro lado, se to- 


mamos t;, tal que O «1, « 1, por exemplo t, = b, e fazemos 
P, =(1 -£,)A +t tB = (2, -1), verificamos facilmente que P, está sobre o seg- 
mento AB. 


Figura 14.2.6 


14.2.5 Definição: Um subconjunto S do R” é chamado convexo se para 
quaisquer dois pontos A e B de $ o segmento AB está inteiramente contido 
em S. 
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Exemplo 


é convexo 


não é convexo 


(a) 


N, 


é convexo o 
mi 


não é convexo 


to) 


é convexo 


(f) 


Figura 44.2.7 
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14.2.6 Teorema: Um semi-espaço fechado é convexo. 


Prova: Mostremos isso no caso de R?. (O caso geral é feito, usando o mesmo 

argumento.) No caso de R?, um semi-espaço fechado é constituído por pontos 
(x, y), que satisfazem uma expressão do tipo ax + by + c <0. 

Precisamos mostrar que se tomarmos dois pontos quaisquer do semi-espaço, o 

segmento que une estes pontos está contido no semi-espaço. Sejam A = (Xo, Yo) 
e B = (xı, yı) dois pontos quaisquer do semi-espaço, e seja P um ponto qual- 
quer de AB. Existe, então, 1 E R, com O <t, < 1, tal que 


P = (1 -tXo Yo) + tlx yı) 
(-rDxo tt, (l-21)Yo + ty) 
e temos que verificar se: 
(+) dQ-nbo + txi] +bEC-tWo + tyi] +e <o, 

que é a condição para P estar no semi-espaço. Mas 

ali - ti)xo + tix] + bE - t)Yo + tyi te= 

= (l - t,)aXo + tax, + (1l -~ t)byo t tiby, + (l-t) + tic 

=(1-t)laxo + byo + cl+tilax, + by, + c), 
e como axo t byo + c SO eax, + by, te <O (pois A e B estão no semi- 
-espaço) e 1 - ti > 0ezt, > 0 (pois 0 S żf, < 1), a relação (+) é satisfeita. 
Assim, como P está no semi-espaço e P era um ponto arbitrário de AB, então 


o segmento ÀB está inteiramente contido no semi-espaço e, portanto, este é 
convexo. 


14.2.7 Teorema: A intersecção de conjuntos convexos é um conjunto 
convexo. 


Prova: Sejam S, e S, dois conjuntos convexos. Precisamos mostrar que se A e 
B são dois pontos quaisquer de S, N S,, então AB C S, NS. pn 

Mas se A, B E€ $, NS, então A, B E S, e como S, é convexo, ABES. 
Analogamente, se A, B E€ S, A S,, então A, B € S, e como S, é convexo, 
ÀB E S,. Como ÀB está contido simultaneamente em S, e S3, então 

AB E€ S, N S,. Portanto S, N S, é convexo. 


14.2.8 Definição: Uma região poliedral convexa fechada em R” é uma 
intersecção de uma quantidade finita de semi-espaços fechados do R”, 


Devido aos dois teoremas anteriores, uma região poliedral convexa é um 
conjunto convexo. 


14.2.9 Um conjunto A C R” é dito limitado se existirem constantes 


kp i= l,...,n tais que, se (x1, ..., x, JE A então Xi Skp i=1,..,n. 
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14.2.10 Exemplos 


Exemplo 1: 


região convexa não limitada 
do R? 


região 
convexa 
limitada 


(a) 


região convexa limitada 
do RI 


td) 


Figura 14.2.8 


Note que da maneira como foi definida uma região poliedral convexa 
fechada é sempre obtida por um sistema de desigualdades lineares (uma 
desigualdade para cada semi-espaço). Como exemplo veja (3) de 14.2.3 
e Figura 14.2.5. 

Numa região poliedral convexa, procuramos pontos especiais — os vértices. 
Na região poliedral convexa do exemplo 14.2.3, eles são os pontos 


P, = (0, 2), P2 =(3, £)Ps;=(5,%)eP, =(3.0). Note que estes pontos 


são dados por intersecção de duas das retas que definem os semi-espaços. Assim, por 
exemplo, P, é dado pela solução do sistema 
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| 
© 


Exemplo 2: i e 
emplo 2: Consideremos a região poliedral convexa fechada de R?, dada 


3x+2y-3 = 
8x +2y-4 = 


| 
o 


Note, porém, que o ponto (0,3 ) que é solução do sistema 


Ra =0 
x = 0 


não pertence à região A. 
Este comentário nos leva a: 


14.2.11 Definição: Dada uma região poliedral convexa fechada do R” (de- 
terminada por um sistema de inequações lineares), Os vértices dessa região são 
os pontos da região que satisfazem um dos possíveis sistemas de n equações 
lineares independentes, obtidas substituindo-se as desigualdades por igualdades. 


Observação: Depois de resolver um sistema, a fim de verificar se O 
ponto está na região, testamos para ver Se ele satisfaz todas as desigualdades. 


14.2.12 Caracterização Geométrica dos Vértices: Os vértices que aqui foram 
definidos “algebricamente”” são os pontos extremos da região poliedral convexa R. 
Com isto queremos dizer que eles são os pontos da região que não estão contidos no 
“interior” de nenhum segmento contido na região. Mais formalmente: “P é vértice 
de R se, e somente se, P está num segmento AB contido em R então P= À 
ou P = B”. Prove este fato! Sugestão: Se P € R” satisfaz uma igualdade 
ax to taçk + b = O (hiperplano), então ptv è p- v satisfazem 
a desigualdade correspondente se, € somente se, » satisfaz a igualdade 
0x1 +... t4pXy =0 (lembre-se depois disto que a única solução de um sistema 
homogêneo de n-equações LI é o vetor nulo). 


14.2.13 Exemplo 1: A região A do problema 14.2.3 é descrita pelas 
desigualdades 
x20 
y20 
3x +2723 
x+3721,5 
8x +2y24 


Ao substituirmos por igualdades e tomarmos os sistemas de duas equações 
obtemos 10 = (4 ). Dentre estes, determinaremos os vértices, verificando quais 
satisfazem o sistema de inequações que definem a região A. Neste caso, teremos 
apenas os pontos P,, P., P3 e P4 nestas condições. Verifique! 


pelo sistema de inequações lineares 


x+ ytz<s3 


y-2<2 
x~ 2y <] 
x >0 


Então os possiveis ve es sã0 dado: elos sistemas e três equações 


x + ytz=3 


RP =l quações) 


x + y Ze 3 
a gi Sa 
X pae E i => (0, 5» 7) (está na região) 


xt ytz= 3 “1 
x» 1 200,5, 5) (está na região) 


a região é 


( 


y-z=2 
X- = Se 
2y l = (0, 5 =) (está na região) 
E 


Figura 14.2.9 


-Z= 
y 2 = (3, 1, -1) (está na região, pois satisfaz todas as ine- 
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Agora, estamos em condições de caracterizar problemas como o introduzido 
em 14.2.3 e que podem ser resolvidos pela técnica específica que é a programação 


linear. 


14.3 INTRODUÇÃO À PROGRAMAÇÃO LINEAR (PL) 


A programação linear trata do problema específico de: 
Maximizar ou minimizar uma função do tipo 
f(x, Xn) = aX: +..tagxç tb, 
restrita a um subconjunto A poliedral convexo de RN. 


(Note que f:R” >R é uma transformação afim, isto é, 
flx)=L(x)+b onde L é uma transformação linear, be R.) 

Na linguagem de programação linear (PL), f é chamada função objetivo 
(f.o.) e A é denominada região factível. 

No exemplo da seção 14.2.3, f.o. é dada por f (x, y) = 10x + 8y 
e a região factível é a região 4 descrita por: 


x20 

»20 
3x+2y23 
x+3y21,5 
8x +2y24 


Nosso problema é minimizar f restrita a 4. 


14.3.1 Método Geométrico 


Vamos (finalmente!) resolver o problema proposto em 14.23.0 
procedimento que vamos seguir é conhecido como método geométrico de 
resolução em PL. 

Vamos reescrever a f.o. acima, utilizando produto interno do Rº. 


fix, y)= < (10,8), (x, y) ), c = (10, 8) é denominado vetor gradiente 
e x=(x, y). 


Observação 1: f é constante nas retas perpendiculares ao vetor € = (10, 8). 


De fato: 
Uma reta perpendicular a € pode ser escrita na forma paramétrica do 


seguinte modo: 


“10x +8By= 
Sa a x vy=72/7 


` 10x +8y =0 
Figura 14.3.10 


(x, y) = (0*,7*) + à (-8,10) 
ou seja x =x* +À c+ 


onde x* = (x*, y*) é o vetor deslocamento, que podemos tomar na direção de c. 
Portanto, f(x, y)=te,x)=(ext+AcD=(cx)= c * x* cosae, neste 
caso, cos a =1. 


Observação 2. Da observação 1 você pode notar que f será tão menor quanto 
menor for o deslocamento x*, ou seja, f(x, y) assume seu mínimo no ponto 
(ou pontos) da região factível que estiver na reta perpendicular a c, mais próximo 
da origem. Em nosso problema, o ponto é(—,—) =P; que é um vértice da 
região factível. Pao 


14.3.2 Exemplo: Uma fábrica produz dois tipos de geradores, tipo A e tipo B, 
e cada um deles deve passar por duas máquinas, C e D. Para fazer um gerador 
do tipo A, a máquina C deve trabalhar 2 horas e a máquina D deve trabalhar 
4 horas. Para fazer uma unidade do tipo B, as máquinas C e D devem trabalhar 
respectivamente, 4 e 2 horas. As máquinas podem trabalhar 24 horas por dia. 
Sabe-se que a fábrica tem um lucro de 3.000 u.c.p. por um gerador do tipo A 
e um lucro de 5.000 u.c.p. por um do tipo B. Além disso, ela vende toda 
a sua produção. Sendo assim perguntamos: quantos geradores de cada tipo a 
fábrica deve produzir, para que seu lucro seja máximo? 
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Chamemos x a quantidade do tipo A e y a do tipo B, e observemos as 
restrições sobre x e y. Se são fabricados x geradores do tipo A, o tempo gasto 
pela máquina C é 2x, e se são fabricados y geradores do tipo B, o tempo gas- 
to pela máquina C é 4y, ou seja, o tempo total usado pela máquina Cé 
2x + 4y, que deve ser menor que 24 horas. Analogamente, temos uma restri- 
ção para a máquina D. Devemos ter, então: 


x20 
y2z0 
2x + 4y <S 24 
4x + 2y S 24 


que nos fornece a região mostrada na Figura 14.3.11, cujos vértices são (0, 0), 
(6, 0), (4, 4) e (0, 6). A função que queremos maximizar é a função lucro. 


N Ax+2y=24 


Figura 14.3.11 


f(x, y) = 3000x + 5000y 


Use o método geométrico descrito no exemplo anterior para determinar 
o máximo de f, observando que, para obter o máximo, você deve “caminhar” na 
região por retas perpendiculares ao vetor gradiente da f.o. e no mesmo sentido dele. 


14.3.3 Tipos de Solução 


Baseado no método geométrico que descrevemos na seção anterior, já se pode 
intuir vários tipos de solução de problemas de programação linear de duas variáveis. 
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p Vamos considerar todos os tipos possíveis de regiões poliedrais convexas no 
R e pesquisar os máximos e mínimos de uma função f(x, y))=ax+by+c. 
Na Figura 14.3.12 tomamos a = 1 e b=2. 


(a) Regiões ilimitadas sem vértices 


(b) Regiões ilimitadas com vértices 
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Podemos observar portanto que a função 


(cl Região limitada (portanto, com pelo menos três vértices) 
flw y)=x+2y+c na região 


R, assume mínimo em toda reta (“fronteira” de R, ) e não assume máximo. 

R, não assume máximo nem mínimo. 

R, não assume máximo nem mínimo. 

R, assume mínimo nos vértices A e B, portanto assume mínimo em todo 
segmento AB, e não assume máximo. 

R; assume mínimo no vértice A e máximo no vértice C. 

R$ não assume máximo nem mínimo. 

R, assume máximo no vértice À e não assume mínimo. 

Re assume mínimo no vértice B e máximo no vértice 4. 

Ro tem o valor máximo igual ao valor mínimo e igual a f (A). 


Exercício: a) Descreva, através de inequações, as regiões R,, R$, ..., Ro 
acima. 

b) Faça um estudo semelhante ao que foi feito acima para determinar 
os máximos e mínimos de f(x, y)=-2x + y + c nasregiões R,,R,,..., Ro. 


(td) Casos degenerados 


14.3.4 Resolução do Problema para n-variáveis 


Podemos estender o método geométrico descrito no Exemplo 14.3.1 para 
problemas de PL em geral. Teremos então para f (x1, -.-, X4) = 41X1 +...+ 
+a,X, t bo vetor gradiente c=(2,,42,...,4,)E R”. Em termos de produto 
interno temos f(x) =(x, dt+b,x=(x,,...,x,). A função objetivo será, portanto, 
constante nos hiperplanos perpendiculares a c. (Para as noções de perpendicularismo e 
co-seno do ângulo entre vetores do R”, consulte, se necessário, o Capítulo 8.) 

No caso de problema envolvendo três variáveis ainda é possível visualizar 
geometricamente. Os pontos de mínimo ou máximo da f.o. serão procurados 
varrendo-se a região factível por planos perpendiculares ao vetor gradiente 
c=(a,,0,.0))E R?. 


(semi-reta) 


Exercício: Para fixar melhor este procedimento, considere a função 
f(x, y,z)=4-x-2y + z. Determine o valor máximo e o valor mínimo que 
f assume na região descrita no Exemplo 2 de 14.2.13. Observe os pontos onde 
isto ocorre. 

Fica difícil, trabalhar na prática com este procedimento geométrico para 
quatro ou mais variáveis. Mas esta noção de procurar máximos e mínimos da função 
objetivo por uma varredura de hiperplanos perpendiculares ao gradiente nos 
permite intuir dois fatos cruciais na programação linear. 


tponto) 


(segmento) Figura 14.3.12 
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i} A função objetivo assume necessariamente um valor máximo e um valor minimo 
quando a região poliedral convexa (factível) for limitada. 


ii) Os vértices desempenham um papel fundamental na procura de máximos e mínimos 
para a função objetivo. 


Volte aos exemplos anteriores de PL, tente observar o porquê deste fato. 
Na próxima seção vamos formalizar esta última observação, estabelecendo o 
resultado que é fundamental na resolução de problemas de PL. 


14.3.5 Teorema Fundamental da Programação Linear 


O primeiro resultado nos diz que os valores extremos de uma função afim 
são assumidos nos pontos extremos dos segmentos. 


Lema 1: Seja f(x1,..., Xp) = 81X1 42X2 +... tank + b e seja P um ponto 
interior a um segmento AB do Rº,istoé, P=AA+(1-A) B,O<A<1. 
Então teremos f (A) <f P) <J (B) ou fF(B)<f(P<F(A). 


Prova: Como P=hA+(1-A) Be f é uma transformação afim, 
fŒ) =L x) b, onde L (x)= L (xi, Xy) = 481X1 +82X1 t...ta,x, é linear, 
fEO=LP)+b=L(AA+(1-A)B)+b=AL(A})+ (1-A)L(B)+b. 


Suponha f (A) <f (B) > L(A)J<SL (B) 
Como f(P)=AL(A)+(]- M)L(B)+b temos 
AL(A)+(1- XZ (A)+b<f@P)<AL(B}+ (1-A) (B)+b. 


L(A)+b<f(P<SL(B)+h 
Portanto: 
f(A <S P) <S (B) 
Da mesma forma, se tivermos f (B) <f (A) mostramos que f(B)<f(P)<f(A). 


Uma conseqüência deste resultado é o lema a seguir, que você poderá provar 
como exercício. 


Lema 2: Seja f (X1, ..., Xp) = 41X1 tax, +... tax, tb. Se dentre os 
valores que f assumir num segmento AB do R”, o valor máximo (mínimo) for 
assumido num ponto P interior deste segmento, então f será constante em AB. 


Analisando os enunciados dos lemas 1 e 2 e a natureza de uma região 
poliedral convexa, estamos em condição de enunciar o principal resultado da PL. 
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Teorema Fundamental da Programação Linear 


Seja f X1, -, Xy) = 41X; +... tax, +b definida numa região poliedral 
convexa 4 do R”. Suponha que f assuma um valor máximo (mínimo) nesta 
região. Então, se A possui vértice(s), este valor máximo (mínimo) será assumido 
num vértice. 

Prova: (Para regiões A do R? .) Suponhamos que o valor máximo (mínimo) 
de f seja assumido num ponto P de 4. 


Considerando todas as regiões poliedrais convexas possíveis do R? (veja 
14.3.3), podemos ter: 


i) P é um vértice. (Neste caso o teorema já estará provado.) 


ii) P está numa aresta. Do lema 2, f assumira este valor máximo (mínimo) 
em toda aresta. Como a região 4 possui vértice(s) esta aresta conterá 
um vértice v obrigatoriamente. (Por quê?) Portanto, f P} = f(v). 


iii) P está no interior de A. Neste caso, f será constante em toda região A. 
De fato: 


Figura 14.4.12 


Seja Q um outro ponto interior de 4. Como A é poliedral convexa, o 
segmento QP está contido em A; além disso, como P é interior, podemos 
considerar um prolongamento Q Q deste ainda contido em 4. Do lema 2 segue 
que f é constante em QQ' e, portanto, f (P) =f (Q). 


Observação 1: A prova deste teorema para n-variáveis vai envolver um número maior 
de possibilidades: o ponto inicial de máximo (mínimo) poderá estar 


i) num vértice; 
ii) numa aresta (solução de (n - 1) - equações). Neste caso, o máximo (mínimo) 


será assumido em toda a aresta que é um subconjunto de dimensão 1; 


Biblioteca de 
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iii) numa face (solução de (n - 2) - equações). Neste caso, o máximo (mínimo será 
assumido em toda a face que é um subconjunto de dimensão 2; 


ni) num ponto interior da região A (que tem dimensão n). Neste caso, a função será 
constante em toda região. 


Pode-se mostrar que em todos estes casos, quando a região tem vértices, 
conseguimos um vértice v onde a função assume seu máximo (mínimo), 


fE) = fP). 


Observação 2: É este teorema que permite, nos casos em que, pela natureza da 
função, já sabemos que ela assume máximo (mínimo) encontrá-lo apenas 
determinando seus valores nos vértices da região poliedral convexa. 


Exemplo: No problema proposto na seção 14.2.3, temos 
f(x,y) =10x + 8y > Opoisx > Qey 20. 
fé, portanto, limitada inferiormente, o que nos permite concluir que ela assumirá 
um mínimo na região que é fechada. Para encontrá-lo, bastará portanto calcular 
o valor da função nos vértices da região. 


Regiões Limitadas 


Uma situação onde, para qualquer função objetivo, temos necessariamente 
máximo e mínimo acontece quando a região A for limitada. Para mostrar este fato, 
você deve voltar para a solução geométrica dos problemas de PL (14.3). Note que, 
ao varrermos o R” por hiperplanos perpendiculares ao vetor gradiente da f.o., 
sempre tocaremos a região 4 uma primeira e uma última vez. Além disto, uma 
região poliedral convexa limitada claramente possui vértices (por quê?). Isto nos 
permite reescrever o teorema fundamental PL para este caso. 


Teorema: Seja f (x1, X2, -s Xy) =41X1 +... tG,X, + b definida numa região 
poliedral convexa limitada A. Então f assume seus valores máximo e mínimo nos 
vértices de 4. 


Algoritmos para Resolver Problemas de PL 


Vimos nesta seção que grande parte dos problemas de programação linear se 
resolve analisando-se apenas os valores da função objetivo nos vértices da região 
factível. Tanto a determinação dos vértices (resolução de sistemas lineares) quanto 
o cálculo da f.o. nestes são possíveis de algoritmos e de programação para 
calculadoras. microcomputadores e computadores. Na próxima seção introduziremos 
um destes métodos, conhecido por método simplex. 
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Programação Linear Inteira 


Muitos problemas práticos podem ser formulados como maximizar ou 
minimizar uma função do tipo f(X,,..., Xp) =a,X, +... +4,X, tb numa região 
poliedral convexa, com a restrição adicional que as variáveis são inteiros. Este é 
o caso por exemplo do problema proposto em 14.3.2. 

Na resolução de um problema de PL, nem sempre o máximo ou mínimo 
ocorrem em pontos cujas coordenadas são números inteiros, condição indispensável 
na formulação de certos problemas. Existem técnicas para se determinar soluções 
inteiras ótimas (máximo ou mínimo), isto é, soluções mais próximas dos vértices 
de máximo ou mínimo. Em alguns problemas você poderá fazer isto intuitivamente, 
veja Exercício 16 de 14.4. No caso geral, estes problemas são tratados na subárea 
de PL denominada Programação Linear Inteira (veja referências ao final do capítulo) 


*14.4 EXERCICIOS 


1. Na definição de variedade linear em 14.2.1 prove que vo E A. O vetor vo é 
único? W é único? Interprete geometricamente. 


2. Desenhe a região em R°, definida pelas desigualdades 


2x + y+920 
-x+3p,+620 
x+2y-3<0 


Quais são seus vértices? 
3. Desenhe a região definida em Rº, pelas desigualdades anteriores. 
4. Quais são os vértices da região poliedral convexa em R?, definida por 
x20 
2x + 3y <2 


3x +2y <2 
x+ ysl 


Desenhe esta região. 

5. Se duas regiões poliedrais convexas são definidas por dois conjuntos de desi- 
gualdades lineares, a intersecção destas regiões é definida por qual conjunto 
de desigualdades? 


6. A união de dois conjuntos convexos é convexa? 
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. Sejam A = (1, 2, 3) e B = (0; 1, -1) dois pontos de R°. O ponto (0, 0, 0) 


está sobre o segmento AB? 


. Uma região poliedral convexa fechada de R? tem vértices (-2, 0), (3, 4), 


(1, 0) e (-1, -1). Ache um conjunto de desigualdades que defina esta região. 


. Ache os pontos de máximo e os pontos de mínimo da função f(x, y) = 


=7x + 5y + 2 definida na regiao determinada pelas desigualdades 


2x + y+920 
-x+27y+620 

x>0 
x+ y-4<0 


. Uma máquina produz dois tipos A e B de frascos de vidro, mas não simul- 


taneamente. Ao produzir um frasco do tipo A ela gasta 0,2 horas, e ao pro- 
duzir um tipo B, gasta 0,4 horas. Sabendo que a máquina pode trabalhar 

no máximo 16 horas por dia e que o fabricante tem um lucro de 2u.c.p. 
com um frasco tipo A e 3u.c.p. com um frasco tipo B, quantos frascos 
de cada tipo devem ser produzidos para que o lucro seja máximo? 


Uma companhia de transportes dispõe de 4 caminhões com capacidade para 
transportar 5.000 kg, 4 caminhões de 10.000 kg de capacidade e 2 caminhões 
de 20.000 kg de capacidade. O custo por hora dos caminhões do primeiro 
tipo é 200 u.c.p., do segundo 300 u.c.p. e do terceiro 400 u.c.p. Como 

devem ser usados os caminhões para transportar uma carga de 80.000 kg, 
para que o custo seja minimo? 


Uma indústria produz porcas, parafusos e pregos, podendo usar dois métodos 


distintos (mas não simultaneamente) para produzi-los. O primeiro método pro- 


duz 3.000 porcas, 2.000 parafusos e 2.500 pregos por hora, enquanto o se- 
gundo produz 4.000 parafusos e 4.000 pregos por hora, mas nenhuma porca. 
A indústria trabalha 18 horas por dia e tem uma encomenda de 5.000 por- 
cas, 5.000 parafusos e 5.000 pregos. Durante quantas horas ela deve empre- 
gar cada método para fazer a entrega o mais rapidamente possivel? 


Seja f(x, y) = 3x + 3y definida na região poliedral convexa abaixo: 

a) Qual o valor máximo e mínimo de f? 

b) Calcule os valores f(A), f(B) e /(P), onde P é um ponto no segmento AB. 

c) Use (a) e (b) para determinar os pontos onde f atinge o máximo e os 
pontos onde assume o minimo. 
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Figura 14.4.13 


14. Numa indústria química há uma caldeira cuja margem de segurança é tal que 


15. 


16. 


a pressão P medida em atmosferas, e a temperatura T, medida em graus Celsius, 
devem ser reguladas de maneira que 10 P + T < 400. Quer-se usar a caldeira 
para que seja processada uma determinada reação. Para que isto ocorra da 
forma desejada, a temperatura deve estar entre 80°C e 300°C, e a pressão entre 
l e 20 atmosferas. A que temperatura e pressão deve trabalhar a caldeira para 
que a reação se processe no menor tempo possível, se sabemos que a 
velocidade da reação é dada por v = 2 T + 30 P + 20? 


Mostre que uma região poliedral convexa limitada A do R? pode ser 
caracterizada pelos seus vértices v;, ..., V„ da seguinte maneira: 


A= XER; x= tt OSASI, i=l} 


Construção de Casas Populares. (Problema coletado pelo Prof. Rodney 
Bassanezzi em Guarapuava-PR.) 


Número de pessoas 
que abriga 


Custo de construção 
(em UPC) 


Demanda 
(n9 de famílias que solicitaram) 
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Verba total disponível: 2.000.000 UPC. 


a) Determine quantas casas de cada tipo devem ser construídas de modo a 
atender o maior número de pessoas possível. 


b) Resolva o item a) supondo que o custo da casa do tipo B passou para 
1.040 UPC. 


c) Estabeleça um critério que leve em conta o número de pessoas e o 
número de famílias que solicitaram as casas. Determine o número de 
casas de cada tipo a serem construídas de modo a otimizar o critério 
que você adotou. 


14.5 METODO SIMPLEX 


14.5.1 Introdução 


O método gráfico apresentado na seção anterior é utilizado apenas para 
problemas com duas ou três variáveis. Para problemas maiores, o método gráfico 
torna-se impraticável, neste caso nós precisamos de uma técnica eficiente para 
resolver problemas de programação linear com mais de três variáveis. Esta técnica 
é o método simplex. 

O método simplex nada mais é do que um algoritmo de busca, isto é, ele 
começa num vértice da região factível e move-se de um vértice factível a outro até 
encontrar o vértice ótimo. Foi desenvolvido em 1947 por George B. Dantzig, e após 
sua concepção houve um crescimento espantoso da programação linear, com 
centenas de livros e artigos publicados nos círculos acadêmicos. Antes de 1947, 

a programação linear era praticamente desconhecida, havendo, entretanto, algumas 
exceções, por exemplo, Fourier (1823), de la Poussin (1911), Kantorovich (1939). 

A pouca utilização da programação linear antes de 1947 era devida à grande 
dificuldade computacional de se resolver problemas lineares, pelo fato de existir 
um grande número de combinações (fact íveis e não-factíveis) a serem pesquisadas. 
Com o método simplex essa dificuldade foi otimizada, pois o algoritmo simplex 
realiza uma busca apenas nos vértices factíveis (que pertencem à região factível). 

Nesta seção, introduziremos o método simplex através da resolução de um 
modelo simples de programação linear. Uma visão algébrica do método simplex 
também será apresentada, para que o leitor verifique que atrás do “procedimento 
mecânico” do método simplex existe toda uma base algébrica. Por último, será 
apresentado um programa na linguagem Basic que resolve problemas de 
programação linear e pode facilmente ser implementado em qualquer 
microcomputador existente no mercado. 
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14.5.2 Exemplo do Fabricante de Móveis 


Problema: Vamos considerar um fabricante de móveis que fabrica apenas 
mesas e cadeiras. Ele tem um lucro! de Cr$4.500,00 em cada cadeira e de 
Cr$8.000,00 em cada mesa vendida. Supõe-se que devido à forte demanda desses 
itens consegue-se vender toda a produção da fábrica. Mas, a produção da firma 
é limitada em dois aspectos: 

1) Cada cadeira produzida utiliza S unidades de jacarandá. Da mesma forma, cada 
mesa de jacarandá produzida utiliza 20 unidades de jacarandá. Dispomos de 
um total de 400 unidades de jacarandá. 

2) Cada cadeira produzida gasta 10 homens-horas e cada mesa produzida gasta 
15 homens-horas. Dispomos de um total de 450 homens-horas. 

O objetivo do fabricante é descobrir qual a quantidade ótima de cadeiras 
e mesas a serem fabricadas, de tal modo que o lucro total seja o maior possível. 


14.5.3 Modelando o Problema Matematicamente 


Em primeiro lugar vamos identificar as variáveis do modelo. Vamos 
chamar de 

x, = número total de cadeiras fabricadas, e de 

x, = número total de mesas fabricadas. 

Uma vez identificadas as nossas variáveis (na terminologia de programação 
linear chamadas de variáveis de decisão), fica fácil estabelecer o modelo 
matemático do problema do fabricante de móveis. 

O lucro do fabricante pode ser expresso da seguinte maneira: 


L =4.500x, + 8.000x, 


e as restrições do problema: 
5x, + 20x, < 400 (restrição de disponibilidade da matéria-prima) 
10x, + 15x, < 450 (restrição de disponibilidade de mão-de-obra) 


X1 20 


estrições de não-negatividade ) 


1 Lucro é definido como o preço de venda menos o custo de fabricação. 
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E assim, o modelo de programação linear do problema do fabricante de 
móveis pode ser estabelecido formalmente da seguinte maneira: 


Max L = 4.500x, + 8.000x, 


s/a 5x, + 20x, <400(R,) 
10x, + 15x, <450(R,) 

xX 20 (R3) 

xı >0 (R4) 


14.5.4 Solução Geométrica 


Desenhando as restrições descritas na seção 14.5.3 obtemos a seguinte 
região factível: 


xı (cadeiras) 


Figura 14.5.13 


Portanto, utilizando o método gráfico verificamos que o vértice € é o vértice 
ótimo e corresponde à fabricação de 24 cadeiras e 14 mesas com um lucro de 
24 + 4.500 + 14 + 8.000 = Cr$ 220.000,00 


14.5.5 Forma Padrão do Problema do Fabricante de Móveis 


Como foi visto nas seções anteriores, a solução ótima para qualquer 
problema de programação linear ocorre num dos vértices da região factível. 
Esses vértices ocorrem onde retas se cruzam. Portanto, antes de resolver um 
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problema de programação linear pelo método simplex, devemos transformar o 
sistema de inequações linares, geradas pelas restrições do problema, em um sistema 
de equações lineares, ou seja, devemos transformar o problema de programação 
linear original na forma padrão. 


Problema do fabricante de móveis: 


Max L = 4.500x, + 8.000x, 


s/a 5x, + 20x, «400 
10x, + 15x, <450 

Xi 20 

X2 20 


Nós devemos transformar a inequação Sx; + 20x, < 400 em equação, para 
isto basta associar uma variável x3, que é chamada de variável de folga, na inequação: 


5x; + 20x, + x3 = 400 
Usando o mesmo raciocínio para a 24 restrição, obtemos: 
10x, + 15x, + x4 = 450 
Logo, o problema na forma padrão fica: 


Max L = 4.500x, + 8.000x, 
s/a Sx + 20x, +x3 =400 
10x; + 15x, + xa =450 
Xi, X2, X3, X4 20 


14.5.6 Algumas Definições 


Considere o seguinte sistema linear: 
aX1ı tank +...tanX =D 
a X1 tankX, +... tla nXn = b2 O 


AmiX1 tam% ++ AmnXn =Dm 
que escrito na forma matricial torna-se 
Ax=b 


Suponha que o posto de A seja igual a m e que n >m. 
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a) Solução Básica 


Dado um conjunto de m equações lineares com m incógnitas, conforme 
definido em (D , vamos chamar de B qualquer submatriz m X m, não-singular, 
formada por m colunas independentes de A (se A tem posto igual a m então tal 
submatriz existe. Por quê? Veja 3.7.1), e seja N a submatriz m X (n — m) formada 
pelas n — m colunas restantes (aquelas que não pertencem a B). Portanto, 

Ax = b pode ser escrito da seguinte maneira: 


Bxp + Nxy =b 


pois A foi particionada em Be N (A = [B, N])e x em Xp € XN 

(x= [xp » Xy D onde Xp 7 [vetor de m componentes formado pelas variáveis 
associadas às colunas de B] e xy = [vetor de (n — m) componentes formado 
pelas variáveis associadas a N]. 

Então, se todos os componentes de xy forem fixos iguais a zero, a solução 
para o conjunto resultante, Bxg = b, é dito ser uma solução básica para (1) com 
respeito à base B. Os componentes de xg são chamados de variáveis básicas e os 
componentes de Xy de variáveis não-básicas. 


b) Solução Básica Degenerada 


Se uma ou mais variáveis básicas em uma solução básica tem valor zero, 
esta solução é dita ser solução básica degenerada. Do ponto de vista geométrico, 
isto ocorre quando temos um vértice determinado pela intersecção de mais 
de duas retas. 

Vamos considerar agora o seguinte sistema 

Ax = b 


x20 ® 


o qual representa as restrições de um problema de programação linear na 
forma padrão. 


c} Solução Factível 


Um vetor x satisfazendo todas as restrições de Dé dito ser factível para este 
sistema. Uma solução factível para (D) que também é básica é chamada de 
solução básica factível. Se esta solução também for uma solução básica degenerada, 
ela será chamada de solução básica factível degenerada. 

Considere agora o problema de programação linear na forma padrão: 


Min cx 


s/a Ax=b (1) 


xz20 
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d) Solução Básica Factível Ótima 


E a solução básica factível que dentre todas as soluções básicas factíveis 
de nos dá o valor ótimo (no caso, o valor mínimo) para a função objetivo. 


Teorema Fundamental da Programação Linear 
Dado um problema de programação linear na forma padrão a) onde A 
é uma matriz m X (n + m) de posto m, 
i) se há uma solução factível, há uma solução básica factível; 
ii) se há uma solução factível ótima, há uma solução básica factível ótima. 
Do teorema anterior e da equivalência entre solução básica factível e vértice 


temos que o método simplex é finito, pois um sistema linear de m equações com 
(n + m) incógnitas tem no máximo 


+n)! EERTE 
Ram) = mtn) soluções básicas 
m mtn! 
A : é ntm 
Logo, o método simplex efetua um número menor que m 


iterações para encontrar a solução ótima, pois o algoritmo simplex é um 

procedimento de busca, isto é, move-se de vértice factível em vértice fact ível, 

ou seja, de solução básica factível em solução básica factível até encontrar o ótimo. 
Considere agora o problema do fabricante de móveis na forma padrão 

conforme estabelecido na seção 14.5.5 e sua resolução geométrica na seção 14.5.4. 


Temos que 
A= 5 20 1 0 
10 15 0 1 


c = [4.500, 8.000, 0, 0] 
X=[Xi X2, X3, X4]T 


b = [400, 450]7 


São soluções básicas: 


1) O ponto A 
Neste caso, a base B é formada pelas colunas de x; e x4 na matriz A. 


Portanto, 


B, = 
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e xp = vetor das variáveis básicas = [x3 x4 ] 
1 0 400 
B; Xg =þb > g a m 
1 0 1 X4 450 
=> Xp, 7 [x3 x4]= [400 450] 


Fixando x, =x, =0 temos que a solução basica associada à base 
B, é Xx =(x1, X2, X3, x4)= (0,0, 400, 450) 


2) O ponto B 
Tomando a base B, = ao. Q , Xp 7&2 X4) 
21 1 
temos 


Bxp=b > 20 O x2 E 400 
15 1 X4 450 
X p = (X2, X4) = (20 150) 
Portanto, fixando x, = x3 =0 temos que a solução básica associada 


à base B, é X = (x1, X2, X3, X4) = (0, 20,0, 150). 
3) O ponto C 


B. = 5 20 
lo 15/0487 *2)5 (24,14) 
A solução básica associada à base B; é 


X = (x1, X2» X3, X4) = (24, 14, 0, 0) 


4) O ponto D 
Sd 
B4 = „Xa =(x,,x3)=(45,175 
10 0 B4 (x, 3) ( ) 


A solução básica associada à base B4 é 
X = (x1, X2, X3, X4) = (45,0, 175, 0) 


5) O ponto E 
Bs = |% 1| „xp = (2, x3)= G0, -200) 
15 0 


A solução básica associada à base B; é 
X = (X1, X2, X3, X4) = (0, 30,- 200, 0) 


6) O ponto F 
B= |° °] ,xp =, x4)=(80,-350) 
10 1 
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A solução básica associada à base B, é 


X = (X1, X2, X3, X4) = (80, 0, 0, —350) 


São soluções básicas factíveis (vértices). 
1) o ponto A; 
2) o ponto B; 
3) o ponto C; 
4) o ponto D. 


14.5.7 Tableau Simplex 


Vamos reescrever o problema do fabricante de móveis da seguinte forma. 


Max L — 4.500x, — 8.000x, — 0x3 — 0x4 = O 
s/a 5x; + 20x, + 0x3 + 0x4 = 400 
10x, + 15x, +0x, + 0x4 = 450 
X1, X2, X3, X4 20 


O método simplex sempre começa com uma base inicial factível. Como 
no problema do fabricante de móveis todas as restrições são do tipo S, temos 
uma base óbvia que é a identidade, referente às colunas das variáveis de folga 
X3 e X4. 

Portanto, B= | °] ; Xp = [x3 x4 ] = [400, 450] 

0 l 


e xı =x, =Q (se você não entendeu o porquê disso, leia novamente a definição 
de solução básica factível). E o tableau simplex associado a esta base inicial é 


Colunas 
Linhas da função = Valor atual da 
objetivo função objetivo 
Variáveis = bı 
básicas = b, 

Biblioteca de 4: 


Ciência & Tecno 


Pal 
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O tableau simplex acima consiste de: 


1) 6 colunas: A primeira contém informação sobre a base atual (você lê na 
12 coluna a função objetivo L e as variáveis x3 e x4 que são a nossa solução 
básica inicial). As colunas 2, 3, 4 e 5 contêm informação a respeito das 
variáveis X1, X2, X3 € X4, respectivamente. E a última coluna contém na 
12 linha o valor atual da função objetivo e nas duas últimas, os valores atuais 
das variáveis básicas x3 € X4. 

2) 3 linhas: A primeira refere-se à linha da função objetivo; os valores na linha 
da função objetivo (excetuando-se a última coluna) são chamados pela 
terminologia da programação linear de custo reduzido. As duas últimas linhas 
referem-se às duas restrições do problema. 


Para verificarmos se o tableau expressa uma solução básica factível basta 
verificar se os valores das variáveis básicas são > O. O tableau simplex nos diz que 
a nossa base B é composta pelas colunas x, e x, da matriz À (veja a 12 coluna do 
tableau) e os valores das variáveis básicas são lidos na última coluna. O tableau nos 
diz também se a solução básica factível associada à base B é ótima ou não. 


Para sabermos se a solução básica factível é ótima ou não, basta verificar 
se existe alguma variável não-básica que entrando na base melhore o valor 
da função objetivo. 


14.5.8 Verificando quem Entra na Base 


As duas variáveis não-básicas no tableau simplex são x, e x3. 

A coluna de x,, no tableau simplex diz que: “Se aumentarmos a variável 
x, em uma unidade nós utilizamos 5 unidades de x3 € 10 unidades de x4 
com um acréscimo no valor da função objetivo de Cr$ 4.500,00 (repare que 
temos 4.500 porque passamos o custo de x, para o lado esquerdo da 
equação)”. 

A coluna de x, diz que: “Ao aumentarmos a variável x, em uma unidade 
nós utilizamos 20 unidades de x, e 15 unidades de x, e teremos um acréscimo 
de Cr$ 8.000,00 no valor da função objetivo”. 

Como o nosso probléma é maximizar, nós não estamos no ótimo pois 
se entrarmos na base com uma das variáveis não-básicas, x, ou X,, nós teremos 
um acréscimo no valor da função objetivo. 

Há vários critérios de entrada na base, mas o mais comum deles é fazer 
entrar na base a variável não-básica que tiver o custo reduzido mais negativo, 
pois assim nós teremos um acréscimo maior no valor da função objetivo 
(isto não quer dizer que necessariamente chegaremos ao ótimo mais rápido!). 
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Se seguirmos o critério acima, a variável x, entra na base pois ela nos dá um 
acréscimo de Cr$ 8.000,00 no valor da função objetivo (se x, entrasse, nós 
teríamos um aumento de apenas Cr$ 4.500.00). 

Para x, entrar na base alguém precisa sair (para manter o posto de B). 
Quem sai da base? 

Se uma unidade de x, contribui em Cr$ 8.000,00 para o lucro então 
nós devemos aumentar x, o máximo possível, ou seja, nós devemos aumentar 
x» até que ele não viole as restrições de matéria-prima e mão-de-obra. 

Para a restrição de matéria-prima nós temos: 


400 hs ; 
> =20 = indica que como nós temos um total de 400 unidades 


20 À e BENE 
disponíveis de matéria-prima e cada unidade de x, gasta 
20 unidades de xs, então 20 unidades de x, podem ser 
processadas sem que a variável x; torne-se negativa. 


Para a restrição de mão-de-obra temos: 


450 _ 30 = indica que podemos processar 30 unidades de x, sem que 


15 X4 torne-se negativa. 


Portanto, nós devemos fabricar 20 unidades de x, pois se fabricarmos 
mais de 20 unidades a restrição de matéria-prima será violada. Observe que 
quando a variável x, aumenta, a variável x, vai diminuindo, e quando x, 
atinge 20 unidades a variável x, assume o valor zero. 

Portanto, a variável x, entra na base com valor 20 e x, sai da base 
porque zerou. 


Observação: Se houver mais de uma variável básica que assuma valores 
nulos então deve-se escolher apenas uma delas para deixar a base, as demais 
ficam na base com valores iguais a zero (solução degenerada). 


14.5.9 Pivoteamento 


O tableau simplex deve expressar a nova base que é formada pelas 
colunas de x, e x4. À primeira modificação a ser feita no tableau é trocar 
Xa por x, na primeira coluna do tableau. Agora, a fim de que o tableau 
expresse a nova base é necessário isolar x, na sua coluna, ou seja, 


X2 
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Para transformar x, na forma acima nós devemos realizar operações 
no tableau de tal maneira que o elemento-pivô (elemento que se encontra 
na intersecção da coluna da variável que entra na base com a linha da variável 
que sai da base) se tome 1 e os demais elementos da coluna sejam 
transformados em zero. Tal procedimento se chama pivoteamento e nada mais 
é do que realizar operações elementares (veja secção 2.3) no tableau (que é 
equivalente ao sistema gerado pelas restrições do problema na forma padrão) 
com o intuito de transformar a coluna x, na forma citada acima. 

Portanto, após efetuado o pivoteamento o tableau simplex torna-se: 


Tableau 2: 


que corresponde à Ea base 


coluna original de x 4 


p= | O ixo =x x4]= (20, 150] 


15 1 


t 


coluna original de x» 


e temos a seguinte solução básica factível 
x (x1, X2, X3, x4)=(0,20,0, 150) 


E o tableau 2 expressa o seguinte problema: 


Max L — 2.500x, + 0x, + 400x, + 0x, = 160.000 
s/a l/4x, + 0x, + 1/20x, + Ox, = 20 
= 50 


25/4x, + Ox, — 15/20x, + 0x, 


que é equivalente ao problema original pois foram efetuadas operações elementares 


no problema original para se chegar ao problema acima. 


A pergunta que nos surge é: Estamos no ótimo? De novo precisamos verificar 


se ao entrarmos com alguma variável não-básica na base haverá um acréscimo 
(melhoria) no valor da função objetivo. 
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As nossas variáveis não-básicas atuais são x, e x, (por quê? ). Vamos verificar o 
que cada uma dessas colunas expressa. 

A coluna de x; nos diz que: “Ao aumentarmos a variável x, em uma unidade, 
sacrificamos 1/4 unidades de x, e 25/4 unidades de x4 e ao fazermos isto temos 
um acréscimo de Cr$ 2.500,00 no valor atual da função objetivo”. 

A coluna de x3 nos diz: “Ao aumentarmos a variável x; em uma unidade 
usamos 1/20 unidades de x, e ganhamos 15/20 unidades de x4, com decréscimo 
de Cr$ 400,00 na função objetivo”. 

Portanto, se a variável x, entrar na base será um negócio lucrativo. Enquanto 
que se a variável x; entrar na base será um mal negócio, pois o valor da função 
objetivo diminuirá. Logo, a variável x, entra na base. 

E quem sai da base? 

Sai a variável que zerar primeiro. Quando x, REA x, diminui em 1/4; 


portanto, nós podemos aumentar x, até o valor qse T tá 4 = 80 sem que a variável x, 


150 _600 


se torne negativa. E nós podemo: x = 
g p s aumentar X, até => 25/47 75 = 24 sem que 


a variável x4 se torne negativa. Assim, a variável que zera primeiro é a variável xy 
e portanto ela deixa a base. 

Assim, devemos pivotear sobre o elemento-pivô que fica na intersecção 
da coluna x, com a linha da variável básica x4. 

Após efetuadas as operações de pivoteamento sobre o tableau atual temos 
um novo tableau: 


Tableau 3: 


220.000 


o jo fio [ao 
o e ee 


Estamos no ótimo? Para responder essa pergunta precisamos verificar o que 
as colunas das variáveis não-básicas nos dizem. 
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A coluna de x, nos diz que: “Ao aumentarmos x3 em uma unidade 
nós gastamos 4/25 unidades da variável x, e ganhamos 3/25 unidades de 
xı, e esta ação nos leva a um decréscimo de Cr$ 100,00 no valor da 
função objetivo”. Como o problema é de maximização, seria um mal negócio 
fazer a variável x, entrar na base. 

A coluna de x4 nos diz: “Ao aumentarmos x, em uma unidade, nós 
ganhamos 1/25 unidades de x, e gastamos 4/25 unidades de x, ocasionando 
um decréscimo de Cr$ 400,00 no valor da função objetivo”. Esta ação também 
não é lucrativa. 

Como as variáveis não-básicas atuais, x3 € x4, do problema não podem 
entrar na base, pois se isso ocorresse nós teríamos um decréscimo no valor da 
função objetivo, nós estamos no ótimo. 

A base ótima é: 


2 5 
Reids E A 


e a solução básica factível ótima correspondente a esta base é: 
x*=[x,*,x,*,x3*, x4*]=[24, 14,0,0] = solução única e finita 
O valor ótimo 

L*=4.500x,* + 8.000x, * = Cr$ 220.000,00 


Agora, olhando no gráfico da região factível apresentado em 14.5.4 
verificamos o caminho feito pelo método simplex até alcançar o ponto ótimo X* 


A 
B 


1 (inicial) x =(0, 0,400, 450) 


2 x=(0,20,0, 150) 


x*=(24,14,0,0) 


3 


A tabela acima serve simplesmente para verificarmos que o método simplex 
caminha de vértice (= solução básica factível) em vértice até alcançar o 
ponto ótimo. 


14.5.10 Método Simplex — Uma Visão Algébrica 


Considere o problema de programação linear, dado baixo, na forma padrão 
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Min 2 = cx 
sa Àx =b D 
x > 0 


onde 
AE R” x(n + m) 
xE Rix (n+ m) 
bE R! xm 
ce RC tmxi 


O que nós vamos fazer agora é particionar a matriz A em duas submatrizes, 
Be N, que chamaremos de submatriz básica e submatriz não-básica, respectivamente. 
Da mesma forma, faremos isto com os vetores 
x =[Xp> Xy] € €= [cp cn]. 

Uma vez feito isto, nós podemos reescrever o problema expresso em (T) da 
seguinte maneira: 


Min Z = gx + CN*N 
sja = 
/ B xg t Nxy =b (D) 


xp >0, xy >0 


Se expressarmos Bxg + Nxy =b na forma xg =B"!b — B-!Nx, 
e substituirmos este resultado na linha da função objetivo obtemos: 


7 -1 Z =] 
Min z + Oxg +(cgB N-cy)x =coB' P 
-1 —p-1 
s/a Xp +B NxN =B!b 
Xp 20, XN 20 


O problema acima é expresso na forma de tableau da seguinte maneira: 


Este tableau nos dá a representação da linha da função objetivo z e das 
variáveis básicas em termos das variáveis não-básicas. Quando temos uma solução 
básica factível, ou seja, uma solução do tipo X = (Xp, Xy) = (Xp. 0). nós 
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obtemos o valor atual de z (pode ser lido diretamente do tableau na intersecção 
da linha z com a coluna mais à direita do tableau) e os valores atuais das 
variáveis básicas (na coluna mais à direita, logo abaixo da linha de z). 

Sempre que temos uma solução básica factível nós desejamos saber se 
esta solução é ótima ou não. Para sabermos se estamos no ótimo basta verificarmos 
qual é o efeito produzido no valor da função objetivo quando fazemos uma 
variável não-básica, digamos x,, sair do nível zero e passar para um nível positivo; se 
ao fazermos isto ocorrer uma melhoria no valor da função objetivo, então é 
interessante x, entrar na base. Para compreendermos melhor, vamos expressar 
a equação z = cB b — (co BIN — cp }*¥y de outra maneira: 


Z=20 7 G, Re cx, para todo X; pertencente à submatriz N. 


onde: Zo = cB b = valor atual da função objetivo 


L -1 
Z; cgB a, 


(z; — €,) = custo reduzido da variável xX, 

Como o problema é minimizar, então é interessante que x; entre na base 
quando o seu custo reduzido (z, — c,) for maior do que zero, porque assim 
quando x, cresce o valor da função objetivo decresce. Se 
(z; - cj) <0, então o valor da função objetivo aumentará, ou permanecerá 
o mesmo, quando x; aumentar. Portanto, para um problema de minimização 
as nossas candidatas a entrar na base serão as variáveis não-básicas cujo custo 
reduzido (z; — c;) for maior do que zero. Quando uma ou mais variáveis 
não-básicas satisfizerem (z; — c;) > 0 usa-se como critério de desempate escolher 
aquela variável não-básica que tiver o custo reduzido mais positivo. 

Suponha que a variável não-básica x, entre na base ((z, — c,) > 0). Portanto, a 
variável não-básica x, sairá do seu nível zero e passará a ter um valor positivo, mudança 
que acarretará um efeito nas variáveis básicas dado pela equação: 


Xg=b-yyx 
onde b=B”!b = valor atual das variáveis básicas 
yj= B-?a; = coluna da variável x; atualizada 


que pode ser reescrita da seguinte maneira: 


XB, bi Yik 
x b y 
B3 e 2 = 2k 
p=, f Xk 
“Bm bm Ymk 


“eco in 


sont rosie iya t 
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ou ainda, 


XB; = bi = Yi k 
Quando a variável xy cresce podem ocorrer 3 casos: 
1) Se y; > 0, então a variável Xg; diminui à medida que X, Cresce, ou seja, 
Xp; é candidata a sair da base. 
2) Se Vig 


3) Se y; <0, então Xp, cresce à medida que X, cresce. 


=0, então xp não se altera quando Xy cresce. 
1 


Nós só devemos nos preocupar com o caso 1 Yik > 0, pois quando Xk 
cresce, XB, diminui e nós devemos tomar o cuidado de não deixar que x Bi se tome 


negativo. Cada variável básica que tem seu componente em Yx Maior do que 
zero é uma candidata a deixar a base, e deixa a base .aquela que zerar primeiro. 


14.5.11 Tipos de Solução 


Nós podemos verificar através do tableau simplex soluções do tipo: 
a) Alternativa 


Se no tableau simplex tivermos o ótimo e existir uma variável não-básica,, 
digamos xy, com seu custo reduzido (2 — cy.) igual a zero, então nós temos 
soluções alternativas. Isso é fácil de ver pois 


Z = Zo ~ (Zg ~ Cg) Xy e Cg- c) = 0, 


então x, pode entrar na base que o valor da função objetivo z não se altera, 
ou seja, mudamos de uma solução básica factível (vértice) para outra sem alterar 
a função objetivo; isto ocorre quando temos soluções alternativas. 


b) Ilimitada (z > o) 


Se no tableau existir alguma variável não-básica candidata a entrar na base, 
digamos x4, € Yg tem todos os seus componentes menores ou iguais a zero 
(casos 2 e 3 da seção anterior), então nós temos solução ótima infinita, pois Xy 
pode crescer que nenhuma variável básica sairá da base porque crescerá junto 
com x%, mas se as variáveis básicas crescerem sem limite, z que é função dessas 
variáveis crescerá sem limite também. 


Observação: Compare estas observações com 14.3.3. 


Biblioteca de Ya 
Ciência & Tecnol gi: 


Pel 
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14.5.12 Resumo do Método Simplex 


Passos do Algoritmo Simplex — Problema de Minimização 


Passo 1: Ache uma solução básica factível com base B. Forme o tableau simplex 
inicial, 


Passo 2: Calcule (zg — cg) = máximo | (z; — c;) para todas as variáveis 
não-básicas x; | 


Passo 3 (critério de otimalidade): Se (2, - c,) < 0 então pare: a solução 
atual é ótima. Caso contrário, vá para o passo 4. 


Passo 4: Se y, <0, então pare: a solução ótima é ilimitada. Caso contrário, vá 
para o passo 5. 


Passo 5 (teste da razão): Determine o índice r como se segue 


b, _ minimo 
Y,k — 1&i<m 


b, 
—. para apenas os y., > 0 
Yik ik 


Observação: b, =résimo componente do vetor b= R! b 


Passo 6: Pivote em Y,k 
Pivoteamento em y,, é definido como. 


a) Dividaa linha 7 por y,,. 

b)Parai=1,2,..,me ir, atualize a iésima linha da seguinte maneira: 
“multiplique a nova linha z por —y., e some a linha resultante 
à linha i”. 

c) Atualize a linha da função objetivo da seguinte maneira: 


“multiplique a nova linha r por (c,  z,) e some a linha resultante 
com a linha da função objetivo” 


Passo 7. Atualize as variáveis básicas e não-básicas onde xy entra na base e 


Xp deixa a base e volte para o passo 2. 
r 


Observação 1: Se o problema for maximizar, apenas o passo 3 (critério de 
otimalidade) sofrerá (por quê?) 
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Passo 3 (critério de otimalidade): Se (z, — cą) > 0 então pare: a solução atual 
é ótima. Caso contrário, vá para o passo 4. 


Observação 2: O método simplex trabalha apenas com variáveis não-negativas, 
ou seja, x > O. Na prática, isso nem sempre acontece; nestes casos precisamos 
fazer uma transformação de variáveis para garantir que todas as variáveis sejam 
não-negativas (veja bibliografia para maiores detalhes). 


14.5.13 Método das 2 Fases 


Como foi dito na seção anterior o método simplex sempre começa com 
uma solução básica factível inicial. 

Quando nós temos um problema linear com todas as restrições do tipo 
< nós temos uma base factível inicial óbvia, que é a identidade formada pelas 
colunas das variáveis de folga. 

Mas nem sempre isso é possível, neste caso, precisamos de um método que 

nos dê uma solução básica factível inicial. Um desses métodos é o método das 2 fases. 

O método das 2 fases começa com a fase 1, que é a minimização da soma 
das variáveis artificiais, sujeita a restrições Ax + x, =b,x20€ 
x, 20. Se o problema original Ax = b, x 0, tem solução factível, então o valor 
ótimo para a função objetivo da fase 1 é zero, pois todas as variáveis artificiais 
acopladas ao problema original tendem a zero, ou seja, elas deixam a a base; após 
eliminarmos as colunas pertencentes às variáveis artificiais não-básicas, começamos 
a fase 2 que é resolver o problema original com a base factível encontrada na fase 1. 


14.5.14 Resumo do Método das 2 Fases 


Fase 1: Para cada restrição do tipo > ou = associe uma variável artificial. 
Resolva o problema abaixo começando com a solução básica factível 
x=0 e x =b. 
Min z,= 1x 


s/a Ax +x, =b 


x20, x,20 


Se no ótimo o valor de z, # 0, então pare: o seu problema original não tem 
solução factível. Caso contrário, elimine todas as colunas artificiais e a linha 
da função objetivo artificial. Vá para a fase 2. 
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Fase 2: Acople a função objetivo linear original e resolva o problema com 
a solução básica factível xg = B'!be X y =0. Observe que Xp contém as 


variáveis legítimas do problema original uma vez que assumimos que as variáveis 


artificiais deixaram a base. Portanto, nós devemos resolver o seguinte problema: 


Min CpXp FeNXN 
sja Xp + B- Nx =B7'b 
Xg 70, Xy 70 


14.5.15 Programa-Exemplo 


Nesta seção apresentamos um programa escrito em linguagem Basic que 
resolve problemas de programação linear do tipo 


Max z = 


cx 
s/a Ax 
x 


VA 


b 
0 
O programa foi escrito com o objetivo de permitir seu uso em qualquer 


microcomputador existente no mercado. Nos micros do tipo Sinclair (TK82-C, 
TK85, CP200...) deve-se fazer certas alterações: 


i) Usar o comando de atribuição LET em todas as atribuições do programa. 
if) Desprezar a entrada dos dados através do comando DATA e utilizar apenas 
a entrada através do teclado (veja o exemplo da rodada). 


a) Listagem do Programa 


10 FRIO OR A RARO OO OO 
20 Vo % 
30 1 X Este rrosrama resolve k 
40 |! X rroblemas Ge rrogremacao $ 
50 ! x linear do tiro } x 
60 l à x 
70 1 X Max = = ex + 
80 1% 5/8 ž 
?0 1% Ax k 
100 x X + 
110 t k 
120 ! x + 
120 EOG K k k 
1% 
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1% árrass utilizados + + 
k A EN G * 
1X k 
s k o IIC mo) : Vetor que con- & 
1X tem os indices AX 
! x das variaveis x 
! x basicas k 
1 4 AC mentmti > $ hatriz tec- $ 
1X nolosica Bm — kà 
1X rliada tinclui $ 
! vetor ù ) + 
Ux Fi ntm? t Vetor custo + 
x Cil nèm ? } Vetor de cus —k 
Vox tos reduzidos & 
! k k 
Do fama == mm ma ia am a a a mm * 
1X + 
| x OQuservacao + Se a entrada + 
1x de dados for atraves do + 
I x comando DATA » deve ~ se + 
Lx colocar a partir da linha x 
1% 1350 os dados da sesuinte X 
UA forma t + 
1 x $ 
I! Restricao 1 k 
I Restricso 2 k 
É x Presa rs sd ra * 
1x Restricso m & 
EX bt 15 k 
E nt 2 4 k 
I x EEEE x 
FX Dé m 3 x 
1X Gr o) k 
1 x c( 24 4 
LX errre k 
i k cin o)? k 
1X + 
Pesados ao od oo OO A OR K de dk R 


Print * Numero de restricoes ` 


Input ti . 
Frint " Numero de variaveis 
Input N 
NL = N+ 
N? = N+ 


1 
m 
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590 
900 


550 


670 


1000 


1020 
1030 
1040 


N3 = 


N+M +14 


Rem KXk Chamada da rotina de Leitura AX 
Gosuh 650 


Rem 


xXx Chamada da rotina Simelex 4XX 


Gosub 1200 


Enc 
Rem 
Rem 
Rem 
Rem 
Rem 
Dim 
I = 
For 


Frir 
Ineu 
If R 
For 

For 

Read 
Next 
Next 
For 

Read 
Next 
For 

Read 
Next 
Retu 
Erin 
For 

For 

Prin 
Inri 


+*kX Rotina de Leitura 44x 
kxx Declaracao dos arrays XXX 
kxk Nim ILCM)DSÁCMENT)SFONDD)CiCND) 


RAK 


xxx O comentario acima indica as XX 


XXX dimensoes minimas dos arrays k 
ILC1LO)sÁCIOr ZAJ F30)» C1307 
(3 


1 Then Al(I»J)} = | Else ÀA(I»à} 


t * teclado T ) ou relo LATA( Ù b 
t R$ 
= "T" Then 1000 
= 1 tom 
= 1 ton 
Al E) 
J 
I 
I=1 tom 
AC INI O 
I 
I=i ton 
FCI» 
I 
rn 
t * Entrada da matriz de restricoes 
I=1 tom 
J=1 ton 
LE AC ISt" J") = “5 
t ACI JO) 


$ 
I 
J 


kk 


= y 


Entrada da matriz de restricoes relo 


1050 
1060 
1070 
1080 
1090 
1100 
1110 
1120 
1130 
1140 
1150 
1149 
1170 
1180 
1199 
1200 
1210 
1220 
1230 
1240 
1250 
1260 
1270 
1280 
1290 
1300 
1310 
1320 
1330 
1340 
1350 
1340 
1370 
1380 
1390 
1400 
1410 
1420 
1430 
1440 
1450 
1460 
1470 
1480 
1490 
1500 
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Frint " Entrada do Vetor b * 

For | = 1 to M 

Frint * bihi") = "5 

Input AC I5N3 ) 

Next I 

Print * Entrada do Vetor Custo * 
Frint * ( nao inclua folasas ) E 
For I= ł ton 


Frint "cc" = * 
Ingeut FC I ) 

Next I 

Return 

Rem XXk Rotina Simplex XXX 
Z=% 

Ki = O 

Ki = K1 +t 

§1 = ( - Info 

For L = 1 ton? 

For I= 1 toM 

If L= I16 I ) Then 1370 
Next I 

S = 0 

For I = 1 to MH 

J= TIC IO) 

G=S+ FC J) 4 AC TLOS) 
Next I 


Eit Lj =FCLO-S 
If CIC Lt) «= 81 Thern 1370 
Si = Citi) 


R=L 

Next L 

For L = 1 to H 

I? = Ii( Lo 

Ci I2) =ọ 

Next L 

F = Ers 

If S1 «= F Then 1700 
K? = 0 

Y = Inf 


For L= í toh 
T= AC LK) 


If T &= 0 Then 1530 
Q= AC LNI )/T 
If Q >= Ų Then 1530 
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1510 K2 =L 

1520 V=Q 

1530 Next L 

1540 If K2 = Ọ Then 1730 

1550 Ii K2 ) = ķK 

1560 T = 1.0/A0 K29K 3 

1570 For L = i to N3 

1580 AC KZ ) = A( KZ) HT 
L590 Next L 

1400 For L=i tom 

táið If L = K2. Then 1660 

1420 k= ( =- A LIK ) 9} 

1630 For J= 1 to N3 

1640 At Led ) = Al LsJ ) HACKS) XD 
1650 Next J 


1440 Next L 
1670 Z=2+V +51 


1480 Gosub 1750 

1690 Goto 1220 

1700 Frint " Solucso otima * 

1710 Gosub 1780 

1720 Return 

17230 Frint * Solucao Ilimitada * 

1740 Return 

1750 Kem Xkk Rotina de Imrressao XXX 

1740 Erint 

1770 Erint * Iteracao n, "5 Ki 

1780 Frint 

1790 Frint * Valores das variaveis basicas " 
1800 Print 

1810 For L=i tom 

1820 Print ®© XCISIICLISOO = "SAC LoNS > 
1830 Next L 

1840 Print 

1650 Frint * Valor da funcao objetivo é "iZ 
1850 Return 


Existem duas funções pré-definidas: 
i) Eps (linha 1390): menor número representado pela máquina e 
ii) Inf (linha 1200): maior número representado pela máquina 


que foram utilizadas no programa.Caso o seu micro não contenha essas funções, 
atribua valores a Eps e Inf (talvez o manual do micro contenha informações a 
esse respeito). 
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b) Exemplo de uma Rodada 


Vamos utilizar o problema do fabricante de móveis proposto em 14.5.2 
para ilustrar uma rodada do programa. 


Numero de restricoes 
ac 

Nusaro de variaveis 
2 

Entrada da matriz de restricoes pelo 
tecladot 1) ou pelo DAIRI D) 


11 

Entrada da matriz de restricões 
nt. t)=75 
ntt,2)=78 

AZ, 1)=710 

AZ, 2)=70 

Entrada do Vetor b 

b 1) = 2 400 


bi 2) = 7450 

Entrada do Vetor Custo 
í nag inclua folgas ) 
ett)=* 4500 
ct2)=? 8000 


“ 


Haracão n, d 
Valores das variaveis basicas 


= 20 
159 


Mem mar 
H 


Valor da funcao objetivo 2º 160000 
n 


iteracao na 


Vaiores das variaveis basicas 


| 
Po ma 
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ur de funçao objetivo 1 220000 


DOALA 
Yaleres das variaveis Desicas 
i2) = 14 
Si )= 24 


Valar da funcao objetivo : 220000 


Caso o leitor deseje rodar o programa utilizando o comando DATA, deve-se 
acoplar as linhas abaixo ao programa: 


1850 Data 5,20 i Pestricao E. | 
1540 Data 10,15 t Restricau n. 2 
1670 Data 490,450 | Vetar b 

i860 Data 43500,8000 | Vetor Custo 


14.6 EXERCICIOS 


1, ACia. VT produz televisores em cores e em preto e branco. Uma pesquisa de 
mercado indicou que mensalmente podem ser vendidos, no máximo, 4000 
unidades de aparelhos em cores e 1.000 unidades em preto e branco. O setor 
de produção informou que o número de homens-horas disponíveis por mês é 
de 50.000, e um aparelho colorido requer 20 homens-horas e um aparelho 
preto e branco requer 15 homens-horas. 

O Departamento de Vendas informou que para atender os pedidos já 
efetuados este mês, deverão ser produzidos, no mínimo, 800 aparelhos 
coloridos. Os aparelhos são embalados em caixas de papelão e o departamento 
de matéria-prima informou que, por uma falha de previsão, existem disponíveis 
somente 4.200 caixas para a embalagem dos aparelhos e para este mês não 
está prevista nova compra deste material. Os lucros unitários dos aparelhos são 
Cr$ 50.000,00 (colorido) e Cr$ 28.000,00 (preto e branco). Deseja-se 
estabelecer o plano de produção que produzirá o lucro máximo para 
esta indústria. 


2. Arley Tão cria porcos para vender, e ele deseja determinar as quantidades de 
cada alimento que deverão ser dadas a cada porco para obter os requerimentos 
nutricionais a um custo mínimo. O número de unidades de cada tipo de 
ingrediente nutricional básico encontrado num quilo de cada alimento é dado 
na tabela abaixo, juntamente com os requerimentos diários e o custo. 
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Ingrediente | Quilo de | Quilo de | Quilo de | Mínimo requerido 
nutricional milho cereais alfafa diariamente 


Carboidratos 
Proteínas 
Vitaminas 


Custo Cr$ 2.540,00 2.360,00 2.000,00 


. A Cia. Sovina de Investimentos possui Cr$ 6.000.000,00, quantia esta que 


deverá ser aplicada em 5 tipos de investimento, sendo que os retornos para cada 
investimento são: investimento 1 (11): 10%, investimento 2 (12): 8%; 
investimento 3 (13): 6%; investimento 4 (14): 5%; investimento 5 (15): 9%. 

O gerente desta Cia. deseja diversificar os investimentos para obter o 
máximo rendimento possível. Dado o elemento de risco envolvido, o gerente 
restringiu a quantia aplicada no Il a não mais que a quantia total que irá 
investir em 13, I4 e I5 (em conjunto). A quantia total aplicada em I2 e I5 deve 
ser pelo menos igual à quantia aplicada em I3. O D2 deve estar limitado a um 
nível que não exceda a quantia aplicada em 14. 

É preciso determinar a alocação ótima de investimento entre as 
5 categorias, de forma que o retomo ao final do ano seja o máximo possível. 


« Um fazendeiro quer comprar as seguintes quantidades de fertilizantes: 


fertilizante 1: 185 ton; fertilizante 2:50 ton; fertilizante 3: 50 ton; 
fertilizante 4: 200 ton. Ele pode comprar estes fertilizantes em 3 lojas 
diferentes sendo a disponibilidade de cada loja e os custos dos vários tipos 
de fertilizantes nas várias lojas fomecidos nas tabelas abaixo. 


Disponibilidade 


Fertilizante 
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Custo Cr$/ton 


Loja 


Como o fazendeiro pode preencher suas necessidades de fertilizante 
a um custo mínimo? 

5. A Cia. ZigZag possui fábricas em Campinas e Belo Horizonte. Esta Cia. produz 
e distribui máquinas de costura a comerciantes de várias cidades. Numa 
determinada semana, a Cia. possui: 30 unidades em Campinas e 40 unidades 


em BH. Nesta mesma semana, esta Cia. deve atender os pedidos dos comerciantes 


das seguintes cidades: São Paulo: 20 unidades, Rio de Janeiro: 25 unidades e 


Vitória: 25 unidades. 
O problema consiste em distribuir as máquinas aos comerciantes de forma 
a atender os pedidos a um custo mínimo de transporte. Os custos unitários são: 


6. Uma refinaria mistura 4 tipos de gasolina e produz 3 tipos de combustível. 
Os dados são fomecidos nas tabelas abaixo. 


Tipo de Taxa de NỌ de barris disponíveis 
gasolina octano diariamente 
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Combustível Taxa mínima Demanda diária 
de octano 
1 


95% no máximo 10.000 
2 90% =. 
3 85% pelo menos 15.000 


A refinaria vende a gasolina não usada para produzir combustível a 4.900 u.c.p. 
se sua taxa de octano for acima de 90% e a 3.800 u.c.p. se sua taxa de octano 
for menor que 90%. Como pode a refinaria maximizar o lucro total diário? 


7. a) Resolva o problema dos televisores (Exercício 1) pelo método gráfico. 
b) Escreva o problema na forma padrão. 
c) Através da solução obtida no item q), calcule o valor das variáveis de folga 
na solução ótima; 
d) Interprete os valores das variáveis de folga. 


8. Um aluno do curso de MS415 quer aproveitar o que já aprendeu a respeito da 
Programação Linear para resolver um problema particular muito grave. 
Atualmente, ele possui duas namoradas: Maria e Luísa. Ele faz alguns cálculos 
e estudos, dos quais concluiu que: 

a) Maria, muito elegante e sofisticada, prefere frequentar bares e boites mais 
requintados, de modo que uma saida de 3 horas custará Cr$ 1.500,00. 

b) Luisa é mais simples e prefere divertimentos mais populares, de modo que 
uma saída de 3 horas custará Cr$ 800,00. 

c) Após pagar as contas da república onde mora, e outros gastos, restam para 
ele Cr$ 5.000,00 mensais para diversão. 

d) Seus afazeres escolares são muitos (lista de exercícios, programas etc.) e 
consomem muito do seu tempo e energia, de tal forma que lhe sobram, 
mensalmente, 30 horas e 40.000 calorias para as atividades sociais. 

e) Cada saída com Maria consome 3.000 calorias, mas com Luísa, mais alegre 
e extrovertida, gasta o dobro. 

f) É importante colocar que ele gosta das duas com a mesma intensidade. 


Tomando como base as conclusões acima, ele quer planejar sua vida social 
de modo a obter o número máximo de saidas. 

Formule o problema e resolva-o. Após conseguir o resultado, comunique-o 
à classe para que este aluno (que prefere que seu nome não seja revelado por 
razões que parecem óbvias) possa conferir com a solução ótima por ele obtida. 
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9. A Cia. K-SORVETEBOM produz dois tipos de sorvetes: picolé e copinho. 

Nesta Cia. o único ponto crítico é a mão-de-obra disponível. O copinho 
consome 50% a mais de mão-de-obra que o picolé. Sabe-se também que se todo 
o sorvete produzido fosse do tipo picolé a Cia. produziria 400 toneladas por dia. 
O mercado limita a produção diária do copinho e picolé em 150 e 300 toneladas, 
respectivamente. 

O lucro por tonelada de copinho e picolé produzidos é Cr$ 5.000,00 
e Cr$ 3.500,00 por tonelada, respectivamente. 

Formular e resolver o problema que permita determinar a quantidade 
a ser produzida de cada tipo de sorvete. 

Discuta a solução ótima obtida e verifique os valores das variáveis de folga. 


10. Resolva todos os exercícios que você achar interessante (incluindo aqueles 
propostos na solução geométrica e os desta seção) que podem ser resolvidos 
pelo método simplex sem usar o método das 2 fases. 


11. Resolva o Exercício 2 desta seção usando o método das 2 fases. Repare que 


como as restrições são do tipo > então é necessário subtrair variáveis (neste caso 
chamadas de variáveis de excesso) para colocar o problema na forma padrão. 


14.7 RESPOSTAS 


14.7.1 Respostas de 14.4 
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x-2-1<0 
x+ y+220 
|2x- y-2<0 
4 - 5Sy+82>0 


8. 


10. 80 do tipo A e nenhum de B. 
12. O primeiro método 100 minutos e o segundo 25 minutos. 


14. T = 200°C e P = 20 atmosferas 


14.7.2 Respostas de 14.6 


1. Sugestão: faça x, = quantidade de televisores coloridos produzidos 
X, = quantidade de televisores branco e preto produzidos 


3. Seja x, = quantidade aplicada no investimento L 


Max z = 0,x, +0,08x, + 0,06x3 + 0,05x4 + 0,09x; 

s/a x + Xa + X3 + xa + xs = 6.000.000 
Xı s< X3 + X4 + Xs 
X2 txs > 3; X3 SX4 e x,20 


4. Xj = quantidade (em toneladas) de fertilizante i comprado na loja j 


Min z = 450x, + 425x,, + 480x,3 + 180x23 + 200x33 + 
+ 300x31 + 240x33 + 319x41 + 350x42 + 325x43 
s/a X +Xız2 +x = 185 
Xn + X23 = 50 
X31 +x33= 50 
X41 + Xa + Xa3 = 200 


Xu Ss 70 Xa S 60 
x12 <100 X3 S 35 
Xı3 S 100 Xa S 150 
Xa S 30 Xa2 S100 
Xyz S 40 Xa S 70 


5. Sugestão: Xj 7 número de máquinas de costura transportadas da cidade i 
para a cidade j (1 = 1,2. j= 1,2,3} 
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6. xj = barris de gasolina i usados na produção do combustível j 


4 
i E “is i 


4 4 
Max Z = 7.200 E, x, +6.000 se X;, + 5.000 


ns cos a 


3 3 
+ 4.900 [(7.100 — È xs) + (4300 — E xa)l+ 
j= j= 


3 3 
+ 3.800 [(4.000 — Z x) + (5050- E x2] 
1 j= 


j= 


s/a 


4 
0,6 3x4, + 0,86x,, + 0,91x3, + 0,99x,, 2 0,95 2 Xj 


i=1 | 
$ 
0,68x 12 + 0,86x,2 + 0,91x32 + 0,99x42 > 0,90 a Xiz i 
i= 
4 
0,68x 13 + 0,86xX33 + 0,91x33 + 0,99x43 z 0,85 z i Xis 
(= 
3 
2 xı; < 4.000 Xi + Xa + Xz + X4 < 10.000 
j=1 
3 
>) Xaj < 5.050 X13 + x93 + X33 +xa3 < 15.000 
j= 
3 
E x3; < 7.100 x;20 
[=1 
E xaj <4.300 
j=1 
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ÍNDICE REMISSIVO 


A 


Adição de matrizes, 6 
Adjunta, matriz, 72 
Aleatória, variável, 236 
Amostral, espaço, 236 
Ângulo entre dois vetores, 219 
Aplicação 
identidade, 178 
injetora, 151-152 
nula, 195 
sobrejetora, 152 
Auto-adjunto, operador, 253, 258 
diagonalização, 26 1-262 
Autovalor, 16, 180,335 
de uma matriz, 184 
multiplicidade algébrica de, 194 
multiplicidade geométrica de, 194 
subespaço associado, 183 
Autovalores de operadores 
auto-adjuntos, 262 
Autovetor, 16, 180 
de uma matriz, 184 


B 


Base, 116,118, 203 
de um subespaço, 131 
matriz mudança de, 125, 126 
mudança de, 15 
por rotação, 17 
ortonormal, 229 
Bilinear 
forma, 270 
matriz de uma forma, 272 


C 


Cadeia de Markov, 14 
Característico 
polinômio, 1 84 
valor, 180 
vetor fixo, 180 
Cartesianas, equações, 286 
Cilindro, 300 
elíptico, 300 
hiperbólico, 301 
parabólico, 301 
Circunferência, 289 
Cisalhamento, 150 
Classificação 
das cônicas, procedimento geral, 
29, 297-298 
das quadráticas, 299-304 
Coeficientes 
de Fourier, 225-226 
matriz de,65 
Cofator, 70 
Cofatores, 
matriz de, 72 
Coluna, matriz, 3 
Complemento 
algébrico, 70 
ortogonal, 234 
Cone quadrático, 300 
Conjuntos convexos, 350-374 
Cônicas 
classificação, 296, 297-298 
forma reduzida das, 291 
no plano, 289 
Contração uniforme, 147 
Correlação linear, coeficiente de, 238 
Cramer, Regra de, 77 
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D 


Degenerada, hipérbole, 290 

Degenerada, parábola, 290, 291 

Degeneradas, quádricas, 301 

Dependência e independência linear, 
114 

Desenvolvimento de Laplace, 69 

Desigualdade de Schwarz, 228 

Desigualdade trangular, 228 

Desvio padrão, 237 

Determinante, 66 

Diagonal, matriz, 4 

Diagonalização de formas quadráticas, 
277,278 

Diagonalização de operadores, 199 

Diagonalização de operadores auto- 
adjuntos, 261,262 

Diagonalização simultânea de opera- 
dores, 209 

Diagonalizável, matriz, 213 

Dimensão de um espaço vetorial, 119 

Dual, cspaço, 282 


E 


Elementar, matriz, 82 
Elipse, 289 
Elipse degenerada, 291 
Elipsóide, 298 
Elíptico, cilindro, 300 
Elíptico, parabolóide, 299 
Equação diferencial, 317 
Equação diferencial lincar homogênea, 
319 
Equações cartesianas, 286 
Equações diferenciais, sistemas linea- 
res, 316 
Erro, estimativa de, 346 
Escalar 
multiplicação por, 7 
produto, 220,221 
Escalonada, matriz, 190 
Espaço amostral, 236 
Espaço dual, 282 
Espaço vetorial, 103 
complexo, 103, 105 
dos polinômios, 105 
real, 103 
R” , 104 


Espaços vetoriais isomorfos, 156 
Esperado, valor; veja valor médio 
Exato, processo, 332 

Expansão uniforme, 147 


F 


Forma bilinear, 270 
matriz de, 272 

Forma bilinear simétrica, 274 

Forma de Jordan, 210 

Forma escada, matriz-linha reduzida à, 
34-38 

Forma linear, 269 

Forma quadrática, 274 
diagonalização, 277, 278 
positiva definida, 282 

Forma reduzida das cônicas, 291 

Função objetivo, 362 


G 


Gauss, método de, 36,51 

Gauss-Seidel, processo de, 345 

Gram-Schmidt, processo de, 229, 230 
veja processo de ortogonalização 

Grau de liberdade de sistemas de 
equações lineares, 45-46 


H 


Hipérbole, 290 
Hipérbole degenerada, 290 
Hiperbólico, cilindro, 301 
Hiperbólico, parabolóide, 300 
Hiperbolóide de duas folhas, 299 
Hiperbolóide de uma folha, 299 
Homogênca, equação diferencial 
linear, 319 


I 


Identidade, matriz, 4 

Imagem, 151-155 

Impossíveis, sistemas de equações li- 
neares, 29 


Indeterminados, sistemas de equações 
lineares, 44 

Injetora, 196 
aplicação, 151-154 

Intersecção de, 110 

Inversa, matriz, 73 

Inversível, matriz, 335, 337 

Inversão , 66 

Isomorfismo, 156 

Iterativo, processo, 333 


J 


Jacobi, método de, 344 
Jordan, forma de, 210 


L 


Linear 
homogênea, equação diferencial, 
319 
operador, 180 
variedade, 109 
Linha 
matriz, 4 
Linha equivalente 
matriz, 36 
Linha reduzida à forma escada 
matriz, 36-38 


M 


Markov 
cadeia de, 14 
processo de, 14 
Matriz, 1 
adjunta, 72 
coluna, 3 
das probabilidades de transição, 15 
de coeficientes, 65 
de cofatores, 72 
diagonal, 4 
elementar, 82 
escalonada, 190 
identidade, 4 
inversa, 73 
inversível, 184, 185, 335, 337 
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linha, 4 
linha equivalente, 36 
linha reduzida à forma escada, 
36,38 
linhas independentes de uma, 40 
norma de, 188, 189, 340 
nula, 3 
nulidade, 38 
ortogonal, 254 
posto de, 39,45 
produto, 10 
quadrada, 3 
simétrica, 5, 7, 254 
transposta, 7 
triangular, 91 
triangular inferior, 4 
triangular superior, 4 
Matriz de uma transformação com- 
posta, 163 
Matriz de uma transformação inversa, 
165 
Matriz de uma transformação linear, 
157 
Matriz diagonalizável, 213 
Matriz, mudança de base, 125, 126 
Matrizes 
adição de, 6 
iguais, 3 
linha equivalentes, 85 
multiplicação de, 9 
semelhantes, 92 
segiiência de, 12, 178, 333 
série de, 180, 334 
Matrizes semelhantes, 166 
Máximos e mínimos valores, 109 
Médio, valor, 223, 254 
Método 
da variação dos parâmetros, 325 
das duas fases, 391 
de Gauss, 36, 51 
simplex, 374-404 
pivoteamento, 383 
solução geométrica, 376 
tableau simplex, 381 
visão algébrica, 386 
Minimal, polinômio, 206, 207 
Mudança de base, 125 
Mudança de base por rotação, 127 
Multiplicação por escalar, 7 
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N 


Norma, 219-221 
de matriz, 340 
do máximo, 341 

Normalizado, vetor, 227; veja vetor 
unitário 

Núcleo, 151-155 

Nula, matriz, 3 

Nulidade, 162 
matriz, 38 

Número de soluções de sistemas de 
equações lineares, 29 


(8) 


Operações elementares sobre as linhas 

de uma matriz, 35 
Operador 

auto-adjunto, 253, 258 

diagonalizável, 203 

idempotente, 215 

linear, 180 

nilpotente, 214 

ortogonal, 253 

caracterização, 261-262 

Ortogonal, matriz, 254 
Ortogonal, operador, 253 
Ortogonais, vetores, 224, 225 
Ortogonalização, processo de, 229, 230 
Ortonormal, base, 229 


Parábola, 290 
Parabolóide 
elíptico, 299 
hiperbólico, 300 
Parâmetros, método de variação dos, 
325 
Permutação, 66 
Perpendiculares, vetores, 224-225 
Mano, no espaço, 288 
Plano 
retas no, 288 
vetores no, 97 
Polinômio calculado em matriz, 203 


característico, 185 
minimal, 206-207 
Polinômios, espaço vetorial dos, 105 
Possíveis, sistemas de equações 
lineares, 29 
Posto, 162, 187 
de matriz, 39, 45, 80 
Probabilidades de transição, matriz 
das, 15 
vetor de, 15 
Processo 
aleatório, 14 
de Markov, 14 
exato, 232 
iterativo, 232 
Produto 
escalar, 220-221 
intemo, 220-221 
em espaços vetoriais com- 
plexos, 234 
usual, 222 
matriz, 10 
Programação linear, 362 
método 
geométrico, 362 
simplex, 374-404 
programa-exemplo, 392 
teorema fundamental da, 
368,379 


Q 


Quadrada, matriz, 3 
Quádricas 
classificação das, 298-301 
degeneradas, 301 
no espaço, 298 


R 


Reflexão, 148, 178, 181 
Região 
factível, 362 
poliedral convexa fechada, 358 
Reta no plano, 287 
Rotação, 149, 182 


Segmento, 356 
Semi-espaço 
aberto, 354 
fechado, 354 
Simétrica, matriz, 5, 7 
Sistemas de equações lineares, 29 
equivalentes, 32, 36 
grau de liberdade de, 45,46 
impossíveis ou incompatíveis, 44 
indeterminados, 44 
número de soluções de, 44 
possíveis (ou incompatíveis), 44 
resolução de, 29 
solução de, 33,41 
Sistemas equivalentes, 85 
Solução 
de um sistema de equações diferen- 
ciais, 318,319 
geral de uma equação diferencial, 
318 
geral de um sistema de equações 
diferenciais, 318 
Subconjunto convexo, 356 
Subespaços vetoriais, 105 
gerados, 112 
intersecção de, 110 
soma de, 111 
soma direta de, 112 
Submatriz, 70, 80 


T 


Tableau simplex, 381 
base inicial factível, 381 
solução 
alternativa, 389 
ilimitada, 389 
Transformação linear, 142 
Transformações 
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do plano no plano, 147 
lineares inversíveis, 165 
Translação, 150 
Transposição, 7 
Transposta, matriz, 7 
Triangular inferior, matriz, 4 
Triangular superior, matriz, 4 


U 


Unitário, vetor, 227 


Valor 
característico, | 80 
esperado; veja valor médio 
médio, 223,237 

Valores máximos e minimos, 109 

Variação dos parâmetros, método, 
325 

Variação linear, 351 

Variança, 237 

Variável aleatória, 236 

Vanedade linear, 104, 109, 114 

Vazio, 291 

Vértices, caracterização geométrica 
dos, 360 

Vetor 
característico, 180 
de probabilidades, 15, 236 
fixo, 178 

Vetores, 102 


LI, 114 

no espaço, 101 

no plano,97 
Vetoriais 


espaços, isomorfos, 1 56 
subespaços, 105 
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